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Prefacio 


El presente libro es un texto de introduccidn que aborda el diseno y andlisis de experimented Tiene como 
base los cursos sobre diseno de experimentos que he impartido durante mas de 25 anos en la Universidad 
Estatal de Arizona, la Universidad de Washington y el Instituto de Tfecnologia de Georgia. Refleja asimis- 
mo los metodos que he encontrado utiles en mi propia prdctica profesional como consultor en ingenieria 
y estadistica en las areas generates de diseno de productos y procesos, mejoramiento de procesos e inge- 
nieria de control de calidad. 

El libro esta destinado a estudiantes que han Uevado un primer curso de metodos estadisticos. Este 
curso previo debe incluir por lo menos algunas de las tecnicas de estadistica descriptiva, la distribucidn 
normal y una introduction a los conceptos bdsicos de los intervalos de confianza y la prueba de hipotesis 
para medias y varianzas. Los capitulos 10 y 11 requieren un manejo elemental de Algebra matricial. 

Como los requisitos para llevar este curso son relativamente modestos, este libro puede usarse tam- 
bi6n en un segundo curso de estadistica enfocado en el diseno estadistico de experimentos para estudian- 
tes de licenciatura de ingenieria, fisica, ciencias fisicas y quimicas, matematicas y otros campos de las 
ciencias. Durante varios anos he impartido un curso basado en este libro en el primer ano de estudios de 
posgrado de ingenieria. Los estudiantes de este curso provienen de los campos tradicionales de ingenie- 
ria, fisica, quimica, matematicas, investigacidn de operaciones y estadistica. Tambidn he usado este libro 
como base de un curso breve para el sector industrial sobre diseno de experimentos para tecnicos en ejer- 
cicio con una amplia diversidad en su formacidn profesional. Se incluyen numerosos ejemplos que ilustran 
todas las tdcnicas de diseno y andlisis. Estos ejemplos se basan en aplicaciones del diseno experimental 
en el mundo real, y se han tornado de diferentes campos de la ingenieria y las ciencias. Esto lleva al terreno 
de las aplicaciones a un curso acaddmico para ingenieros y cientificos y hace de este libro una util herra- 
mienta de referenda para experimentadores de una amplia gama de disciplinas. 

ACERCA DEL LIBRO 

La presente edicidn constituye una revision sustancial del libro. He procurado mantener el equilibrio en- 
tre los tdpicos de diseno y analisis; sin embargo, hay varios temas y ejemplos nuevos; asimismo he reorga- 
nizado gran parte del material. En la presente edicidn se resalta mds el uso de la computadora. Durante 
los ultimos anos han surgido varios productos de software excelentes que auxilian al experimentador en 
las fases del diseno y el andlisis para esta materia. He incluido las salidas de dos de estos productos, Mini- 
tab y Design-Expert , en varias partes del texto. Minitab es un paquete de software de estadistica de cardc- 
ter general ampliamente disponible, que cuenta con utiles herramientas de analisis de datos y que maneja 
bastante bien el andlisis de experimentos tanto con factores fijos como aleatorios (incluyendo el modelo 
mixto). Design-Expert es un paquete que se enfoca exclusivamente en el diseno experimental, Tiene mu- 
chas herramientas para la construccidny evaluation de disehos, asf como multiples caracteristicas de and- 
lisis. En el sitio web de este libro puede obtenerse una versidn para estudiantes de Design-Expert , y se hace 
una amplia recomendacidn para usarlo. Exhorto a todos los profesores que usen este libro para que incor- 
poren software de computadora en sus cursos. En mi caso particular, llevo a todas mis clases una compu- 
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tadora laptop y un monitor, y todos los disenos o tdpicos del analisis tratados en clase se ilustran eon la 
computadora. 

En esta edicidn destaco aun mas la conexidn entre el experimento y el modelo que puede desarrollar 
el experimentador a partir de los resultados del experimento. Los ingenieros (y en gran medida los cienti- 
ficos de la fisica y la quimica) aprenden los mecanismos fisicos y sus modelos mecanicistas fundamentales 
al principio de su formation acad6mica, pero en la mayor parte de sus carreras profesionales tendran que 
trabajar con estos modelos. Los experimentos disenados estadisticamente ofrecen al ingeniero una base 
valida para desarrollar un modelo empirico del sistema bajo estudio. Despu6s este modelo empirico pue- 
de manipularse (tal vez utilizando una superficie de respuesta o una grdfica de contorno, o quiza matema- 
ticamente) como cualquier otro modelo de ingenieria. A lo largo de muchos anos de docencia he 
descubierto que este enfoque es muy eficaz para despertar el entusiasmo por los experimentos disenados 
estadisticamente en la comunidad de ingenieria. En consecuencia, al inicio del libro planteo la notion de 
un modelo empirico fundamental para el experimento y las superficies de respuesta y destaco la impor- 
tance del mismo. 

Tambidn me he esforzado por presentar mucho mas rapido los puntos criticos en los que intervienen 
los disenos factoriales. Para facilitar este objetivo, condense en un solo capitulo (el 3) el material intro- 
ductory sobre los experimentos completamente aleatorizados con un solo factor y el an&lisis de varianza. 
He ampliado el material sobre los disenos factorials y factoriales fraccionados (capitulos 5 al 9) en un es- 
fuerzo por hacer que el material fluya con mayor eficiencia en la perspectiva tanto del lector como del 
profesor y por hacer mayor hincapie en el modelo empirico. El capitulo sobre las superficies de respuesta 
(el 11) sigue inmediatamente al material sobre disenos factoriales y factoriales fraccionados y modelado 
de regresiones. He ampliado este capitulo, agregando nuevo material sobre disenos dptimos alfabeticos, 
experimentos con mezclas y el problema de un diseho parametrico robusto. En los capitulos 12 y 13 se 
analizan experimentos que incluyen efectos aleatorios, asi como algunas aplicaciones de estos conceptos 
en disenos anidados y parcelas subdivididas. El capitulo 14 es una descripcidn general de temas importan- 
tes de diseho y an&lisis: la respuesta no normal, el mdtodo de Box-Cox para seleccionar la forma de una 
transformation, y otras altemativas; experimentos factoriales no balanceados; el analisis de covarianza, 
incluyendo covariables en un diseiio factorial y mediciones repetidas. 

A lo largo del libro he destacado la importancia del diseiio experimental como una herramienta que 
el ingeniero en ejercicio puede usar en el diseho y desarrollo de productos, asi como en el desarrollo y me- 
joramiento de procesos. Se ilustra el uso del diseho experimental en el desarrollo de productos que sean 
robustos a factores ambientales y a otras fuentes de variabilidad. Considero que el uso del diseho experi- 
mental en las fases iniciales del ciclo de un producto puede reducir sustancialmente el tiempo y el costo de 
conducirlo, redundando en procesos y productos con un mejor desempeno en campo y una mayor confia- 
bilidad que los que se desarrollan utilizando otros enfoques. 

El libro conti ene m&s material del que puede cubrirse sin prisas en un solo curso, por lo que espero 
que los profesores puedan variar el contenido de cada curso o bien estudiar mas a fondo algunos temas, 
dependiendo de los intereses de la clase. Al final de cada capitulo hay un grupo de problemas (excepto en 
el 1). El alcance de estos problemas varia desde ejercicios de calculo, destinados a consolidar los funda- 
mentos, hasta la ampliacidn de principios basicos. 

Mi curso en la universidad lo enfoco principalmente en los disenos factoriales y factoriales fracciona- 
dos. En consecuencia, por lo general cubro el capitulo 1, el capitulo 2 (muy rapido), la mayor parte del ca- 
pitulo 3, el capitulo 4 (sin incluir el material sobre bloques incompletos y mencionando solo brevemente 
los cuadrados latinos), y trato en detalle los capitulos 5 al 8 sobre disenos factoriales con dos niveles y di- 
senos factoriales fraccionados. Para concluir el curso, introduzco la metodologia de superficies de res- 
puesta (capitulo 11) y hago un repaso general de los modelos con efectos aleatorios (capitulo 12) y los 
disenos anidados y en parcelas subdivididas (capitulo 13). Siempre pido a los estudiantes que realicen un 
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proyecto semestral que consiste en disenar, conducir y presentar los resultados de un experimento dise- 
nado estadisticamente. Les pido que trabajen en equipos, pues es la mariera en que se realiza la mayor 
parte de la experimentacidn industrial. Deben hacer la presentacidn de los resultados de su proyecto de 
manera oral y por escrito. 


MATERIAL SUPLEMENTARIO DEL TEXTO 

Con esta edicidn he preparado un suplemento para cada capitulo del libro. En este material suplementa- 
rio se desarrollan temas que no pudieron tratarse con mayor detalle en el libro. Thmbien presento algunos 
temas que no aparecen expresamente en el libro, pero que para algunos estudiantes y profesionistas en 
ejercicio podria resultar de utilidad una introduccion de los mismos. El nivel matemitico de parte de este 
material es mas elevado que el del texto. Estoy consciente de que los profesores usan este libro con una 
amplia variedad de audiencias, y es posible que algunos cursos de diseno m£s avanzados puedan benefi- 
ciarse al incluir varios de los temas del material suplementario del texto. Este material est£ en formato 
electronic en el CD/ROM del profesor (disponible solo en ingl6s) y se encuentra en el sitio web de este 
libro. 


SITIO WEB 

En el sitio web http://www.wiley.com/legacylcollege/enginlmontgomery316490/student/student.html esta 
disponible el material de apoyo para profesores y estudiantes. Este sitio se usar& para comunicar informa- 
cion acerca de innovaciones y recomendaciones para el uso eficaz de este texto. El material suplementa- 
rio del texto puede encontrarse en este sitio, junto con versiones electronicas de las series de datos 
utilizadas en los ejemplos y los problemas de tarea, un plan de estudios del curso y proyectos semestrales 
del curso en la Universidad Estatal de Arizona. 
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Introduction 


1-1 ESTRATEGIA DE EXPERIMENTACION 

Investigadores de pr&cticamente todos los campos de estudio llevan a cabo experimentos, por lo general 
para descubrir algo acerca de un proceso o sistema particular. En un sentido literal, un experimento es 
una prueba. En una perspectiva m£s formal, un experimento puede definirse como una prueba o serie de 
pruebas en las que se hacen cambios deliberados en las variables de entrada de un proceso o sistema para 
observar e identificar las razones de los cambios que pudieran observarse en la respuesta de salida. 

Este libro trata de la planeacidn y realizacidn de experimentos y del an<Uisis de los datos resultantes a 
fin de obtener conclusiones vtdidas y objetivas. La atencion se centra en los experimentos de ingenieria y 
las ciencias fisicas y quimicas. En ingenieria, la experimentacidn desempena un papel importante en el di- 
seno de productos nuevos, el desarrollo de procesos de manufactura y el mejoramiento de procesos. El 
objetivo en muchos casos serfa desarrollar un proceso robusto, es decir, un proceso que sea afectado en 
forma minima por fuentes de variabilidad extemas. 

Como ejemplo de un experimento, suponga que un ingeniero metalurgico tiene interns en estudiar el 
efecto de dos procesos diferentes de endurecimiento, el templado en aceitey el templado en agua salada, 
sobre una aleacidn de aluminio. El objetivo del experimentador es determinar cu£l de las dos soluciones 
de templado produce la dureza maxima para esta aleacidn particular. El ingeniero decide someter varios 
ejemplares o muestras para ensayo de la aleacion a cada medio de templado y medir la dureza de los 
ejemplares despuds del templado. Para determinar cual de las soluciones es la mejor, se usati la dureza 
promedio de los ejemplares tratados en cada solucidn de templado. 

A1 examinar este sencillo experimento salen a relucir varias cuestiones importantes: 

1. iEstas dos soluciones son los unicos medios de templado de interns potential? 

2. £Hay en este experimento otros factores que podrian afectar la dureza y que deberfan investigar- 
se o controlarse? 

3. cCuantas muestras para ensayo de la aleaci6n deber&n probarse en cada solucidn de templado? 

4. 6C6mo deberdn asignarse las muestras para ensayo de prueba a las soluciones de templado y en 
qu6 orden deberan colectarse los datos? 
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5. cQue metodo de analisis de datos debera usarse? 

6. 6Qu6 diferencia en la dureza promedio observada entre los dos medios de templado se conside- 
rarii importante? 

Tbdas estas preguntas, y tal vez muchas mis, tendrln que responderse satisfactoriamente antes de llevar a 
cabo el experimento. 

En cualquier experimento, los resultados y las conclusiones que puedan sacarse dependen en gran 
medida de la manera en que se recabaron los datos. Para ilustrar este punto, suponga que el ingeniero 
metalurgico del experimento anterior utilizd ejemplares de una homada para el templado en aceite y 
ejemplares de una segunda homada para el templado en agua salada. Entonces, cuando compare la dure- 
za promedio, el ingeniero no podrl saber qu6 parte de la diferencia observada es resultado de la solucidn 
de templado y qu6 parte es el resultado de diferencias inherentes entre las hornadas. 1 Por lo tanto, el m6- 
todo utilizado para recabar los datos ha afectado de manera adversa las conclusiones que pueden sacarse 
del experimento. 

En general, los experimentos se usan para estudiar el desempeno de procesos y sistemas. El proceso o 
sistema puede representarse con el modelo ilustrado en la figura 1-1. El proceso puede por lo general vi- 
sualizarse como una combinaci6n de maquinas, metodos, personas u otros recursos que transforman cier- 
ta entrada (con frecuencia un material) en una salida que tiene una o mas respuestas observables. 
Algunas variables del proceso x 2 ,x 2 , ...,x p son controlables, mientras que otras z u z 2 , ...,z q son no controla- 
bles (aunque pueden serlo para los fines de una prueba). Los objetivos del experimento podrian com- 
prender los siguientes: 

1. Determinar cuales son las variables que tienen mayor influencia sobre la respuesta y. 

2. Determinar cu£l es el ajuste de lasx que tiene mayor influencia para quey este casi siempre cerca 
del valor nominal deseado. 

3. Determinar cual es el ajuste de las x que tiene mayor influencia para que la variabilidad de y sea 
reducida. 

4. Determinar cu£l es el ajuste de las x que tiene mayor influencia para que los efectos de las varia- 
bles no controlables z lt z 2 , ..., z q sean mfnimos. 

Como se puede ver por el andlisis anterior, los experimentos incluyen muchas veces varios factores. 
Habitualmente, uno de los objetivos de la persona que realiza un experimento, llamada el experimenta- 
dor, es determinar la influencia que tienen estos factores sobre la respuesta de salida del sistema. A1 enfo- 


Factores controlables 

*1 *2 *p 

iid_ 


Entradas 


Proceso 


Salida 


TFT 

Z 2 Z q 

Factores no controlables 


Figura 1-1 Modelo general de un pro- 
ceso o sistema. 


1 Un especialista en diseno experimental diria que los efectos de los medios de templado y las hornadas se confundieron; es decir, los 
efectos de estos dos factores no pueden separarse. 
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que general para planear y llevar a cabo el experiment!) se le llama estrategia de experimentation. Existen 
varias estrategias que podria usar un experimentador. Se ilustrariin algunas de ellas con un ejemplo muy 
sencillo. 

A1 autor le gusta mucho jugar golf. Desafortunadamente, no le agrada practicar, por lo que siempre 
busca la manera mas sentilla para bajar su puntuacidn. Algunos de los factores que el considera impor- 
tantes, o que podrian influir en su puntuacidn, son los siguientes: 

1. El tipo de palo usado (grande o normal). 

2. El tipo de pelota usada (de goma de balata o de tres piezas). 

3. Caminar cargando los palos de golf o hacer el recorrido en un carrito. 

4. Beber agua o cerveza durante el juego. 

5. Jugar en la manana o en la tarde. 

6. Jugar cuando hace frio o cuando hace calor. 

7. El tipo de spikes usados en los zapatos de golf (metalicos o de hule). 

8. Jugar en un dia con viento o en uno apacible. 

Evidentemente, hay muchos otros factores que podrian considerarse, pero supongamos que dstos son los 
de interes primario. Ademds, teniendo en cuenta su larga experiencia en el juego, el autor decide que los 
factores 5 al 8 pueden ignorarse; es decir, estos factores no son importantes porque sus efectos son tan pe- 
quehos que carecen de valor pr&ctico. Los ingenieros y los investigadores deben tomar a menudo este tipo 
de decisiones acerca de algunos de los factores que examinan en experimentos reales. 

Consideremos ahora c6mo podrian probarse experimentalmente los factores 1 al 4 para determinar 
su efecto sobre la puntuacion del autor. Suponga que en el curso del experimento pueden jugarse un ma- 
ximo de ocho rondas de golf. Un enfoque consistirfa en seleccionar una combinacion arbitraria de estos 
factores, probarlos y ver que ocurre. Por ejemplo, suponga que se selecciona la combinacion del palo 
grande, la pelota de goma de balata, el carrito y el agua, y que la puntuaridn resultante es 87. Sin embargo, 
durante la ronda el autor notd varios tiros descontrolados con el palo grande (en el golf, grande no siem- 
pre es sinonimo de bueno) y, en consecuencia, decide jugar otra ronda con el palo normal, manteniendo 
los demas factores en los mismos niveles usados anteriormente. Este enfoque podria continuar de mane- 
ra casi indefinida, cambiando los niveles de uno (o quiz& dos) de los factores para la prueba siguiente, con 
base en el resultado de la prueba en curso. Esta estrategia de experimentacidn, conocida como enfoque de 
la mejor conjetura, es comun entre ingenieros y cientfficos. Funciona de manera adecuada si los experi- 
mentadores cuentan con una gran cantidad de conocimientos tdcnicos o teoricos del sistema que estan es- 
tudiando, asf como amplia experiencia practica. Sin embargo, el enfoque de la mejor conjetura presenta 
al menos dos desventajas. Primera, supdngase que la mejor conjetura initial no produce los resultados de- 
seados. Entonces el experimentador tiene que hacer otra conjetura acerca de la combinaci6n correcta de 
los niveles de los factores. Esto podria continuar por mucho tiempo, sin garantia alguna de exito. Segun- 
da, supongase que la mejor conjetura inicial produce un resultado satisfactorio. Entonces, el experimen- 
tador se ve tentado a suspender las pruebas, aun cuando no hay ninguna garantia de que se ha encontrado 
la mejor solution. 

Otra estrategia de experimentacidn muy comun en la prdctica es el enfoque de un factor a la vez, Este 
metodo consiste en seleccionar un punto de partida, o linea base de los niveles, para cada factor, para des- 
puds variar sucesivamente cada factor en su rango, manteniendo constantes los factores restantes en el ni- 
vel base. Despues de haber realizado todas las pruebas, se construye por lo general una serie de graficas 
en las que se muestra la forma en que la variable de respuesta es afectada al variar cada factor mantenien- 
do los dem£s factores constantes. En la figura 1-2 se presenta una serie de gr&ficas para el experimento 
del golf, utilizando como linea base los niveles de los cuatro factores: el palo grande, la pelota de goma de 
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G (grande) N (normal) GB (gome TP (tres 

Palo de balata) piezas) 

Pelota 




Figura 1-2 Resultados de la estrategia de un factor a la vez para el experimento de golf. 


balata, caminar y beber agua. La interpretacibn de esta grafica es directa; por ejemplo, debido a que la 
pendiente de la curva de la manera de desplazarse es negativa, se concluiria que hacer el recorrido en el 
carrito rnejora la puntuacion. Con base en estas graficas de un factor a la vez, la combinacibn bptirna que 
se seleccionarfa seria el palo normal, desplazarse en el carrito y beber agua. El tipo de pelota de golf apa- 
rentemente carece de importancia. 

La desventaja principal de la estrategia de un factor a la vez es que no puede tomar en consideration 
cualquier posible interaccibn entre los factores. Hay una interaccibn cuando uno de los factores no pro- 
duce el mismo efecto en la respuesta con niveles diferentes de otro factor. En la figura 1-3 se muestra una 
interaccibn entre los factores del tipo de palo y la bebida para el experimento del golf. Observe que si el 
autor utiliza el palo normal, el tipo de bebida consumida practicamente no tiene efecto alguno sobre su 
puntuacion, pero si utiliza el palo grande, se obtienen resultados mucho mejores cuando bebe agua en lu- 
gar de cerveza. Las interactions entre factores son muy comunesy, en caso de existir, la estrategia de un 
factor a la vez casi siempre producin'! resultados deficientes. Muchas personas no perciben esto y, en 
consecuencia, los experimentos de un factor a la vez son comunes en la practical. (De hecho, algunas 
personas piensan que esta estrategia se relaciona con el metodo cientifico o que es un principio “sblido” 
de ingenierfa.) Los experimentos de un factor a la vez siempre son menos eficientes que otros mbtodos 
basados en un enfoque estadistico del diseno experimental. El tema se analizara con mayor detalle en el 
capitulo 5. 

El enfoque correcto para trabajar con varios factores es conducir un experimento factorial. Se trata 
de una estrategia experimental en la que los factores se hacen variar en conjunto, en lugar de uno a la vez. 



A (agua) C (cerveza) 

Tipo de bebida 


Figura 1-3 Interaccibn entre el 
tipo de palo y el tipo de bebida para 
el experimento del golf. 
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Figura 1-4 Experimento factorial de dos 
factores que incluye el tipo de palo y el tipo 
de pelota. 
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El concepto de diseno experimental factorial es de suma importancia, y varios capitulos de este libro se 
dedican a presentar experimentos factoriales basicos. asi como algunas variantes y casos especiales utiles. 

Para ilustrar la forma en que se lleva a cabo un experimento factorial, considere el experimento de 
golf y suponga que s61o dos de los factores son de interes, el tipo de palo y el tipo de pelota. En la figura 
1-4 se muestra un experimento factorial para estudiar los efectos conjuntos de estos dos factores sobre la 
puntuacidn de golf del autor. Observe que en este experimento factorial ambos factores tienen dos nive- 
les y que en el diseno se usan todas las combinaciones posibles de los niveles de ambos factores. Geom6- 
tricamente, las cuatro corridas forman los vertices de un cuadrado. A este tipo particular de experimento 
factorial se le llama diseno factorial 2 2 (dos factores, cada uno con dos niveles). Debido a que el autor 
considera razonable suponer que jugara ocho rondas de golf para investigar estos factores, un plan facti- 
ble seria jugar dos rondas de golf con cada combinacion de los niveles de los factores, como se muestra en 
la figura 1-4. Un disenador de experimentos diria que se han hecho dos replicas del diseno. Este diseno 
experimental permitiria al experimentador investigar los efectos individuales (o los efectos principales) 
de cada factor y determinar si existe alguna interaccion entre los factores. 

En la figura l-5a se presentan los resultados obtenidos al realizar el experimento factorial de la figura 
1-4. En los vertices del cuadrado se indican las puntuaciones de cada ronda de golf jugada con las cuatro 
combinaciones de prueba. Observe que hay cuatro rondas de golf que proporcionan informacion acerca 
del uso del palo normal y cuatro rondas que proporcionan informacion sobre el uso del palo grande. Al 
encontrar la diferencia promedio de las puntuaciones que estan en los lados derecho e izquierdo del 
cuadrado (como en la figura l -5b), se tiene una medida del efecto de cambiar del palo grande al palo normal, o 
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que conducen a I efecto del palo que conducen a I efecto de la pelota 
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Figura 1-5 Puntuaciones del experimento del golf de la figura 1-4 y calculo de los efectos de los factores. 
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Es decir, en promedio, al cambiar del palo grande al normal la puntuacidn se incrementa 3.25 golpes por 
ronda. De manera similar, la diferencia promedio de las cuatro puntuaciones de la parte superior del cua- 
drado y de las cuatro puntuaciones de la parte inferior miden el efecto del tipo de pelota usado (ver la fi- 
gura l-5c): 


Efecto de la pelota = 


88+91 + 92+94 
4 


88+90+93+91 

4 


0.75 


Por ultimo, puede obtenerse una medida del efecto de la interaction entre el tipo de pelota y el tipo de 
palo restando la puntuacion promedio en la diagonal de izquierda a derecha del cuadrado de la puntua- 
cion promedio de la diagonal de derecha a izquierda (ver la figura l-5d), cuyo resultado es 


Efecto de la interaction pelota-palo 


92+94+88+90 88+91 + 93+91 
4 4 


0.25 


Los resultados de este experimento factorial indican que el efecto del palo es mayor que el efecto de 
la pelota o que el de la interaction. Podrian usarse pruebas estadlsticas para determinar si cualquiera 
de estos efectos difiere de cero. De hecho, el caso es que hay evidencia estadfstica razonablemente sOlida 
de que el efecto del palo difiere de cero y de que no es el caso para los otros dos efectos. Por lo tanto, tal 
vez el autor deberia jugar siempre con el palo grande. 

En este sencillo ejemplo se pone de manifiesto una caracteristica muy importante del experimento 
factorial: en los disenos factoriales se hace el uso mas eficiente de los datos experimentales. Note que este 
experimento incluyo ocho observaciones, y que las ocho observaciones se usan para calcular los efectos 
del palo, de la pelota y de la interaction. Ninguna otra estrategia de experimentation hace un uso tan efi- 
ciente de los datos. Esta es una caracteristica importante y util de los disenos factoriales. 

El concepto de experimento factorial puede extenderse a tres factores. Suponga que el autor desea 
estudiar los efectos del tipo de palo, el tipo de pelota y el tipo de bebida consumida sobre su puntuaciOn 
de golf. Suponiendo que los tres factores tienen dos niveles, puede establecerse un diseno factorial como 
el que se muestra en la figura 1-6. Observe que hay ocho combinaciones de prueba de estos tres factores 
con los dos niveles de cada uno de ellos y que estos ocho ensayos pueden representarse geometricamente 
como los vertices de un cubo. Se trata de un ejemplo de un diseno factorial 2 3 . Como el autor sdlo desea 
jugar ocho rondas de golf, este experimento requeriria que se juegue una ronda con cada una de las com- 
binaciones de los factores representadas por los ocho v6rtices del cubo de la figura 1-6. Sin embargo, al 
comparar esta situation con el diseno factorial de dos factores de la figura 1-4, el diseno factorial 2 3 pro- 
ducirfa la misma information acerca de los efectos de los factores. Por ejemplo, en ambos disenos hay 
cuatro pruebas que proporcionan information acerca del palo normal y cuatro pruebas que proporcionan 



Figura 1-6 Experimento factorial de tres factores que 
iucluye el tipo de palo, el tipo de pelota y el tipo de bebi- 
da. 
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Figura 1-7 Experimento factorial de cuatro factores que incluye el tipo de 
palo, el tipo de pelota, el tipo de bebida y la manera de desplazarse. 


information acerca del palo grande, suponiendo que se repite dos veces cada corrida del diseno de dos 
factores de la figura 1-4. 

En la figura 1-7 se ilustra la forma en que podrian investigarse los cuatro factores —el palo, la pelota, 
la bebida y la manera de desplazarse (caminando o en carrito) — en un diseno factorial 2 4 . Como en cual- 
quier diseno factorial, se usan todas las combinaciones posibles de los niveles de los factores. Puesto que 
los cuatro factores tienen dos niveles, sigue siendo posible hacer la representation geometrica de este di- 
seno experimental mediante un cubo (en realidad un hipercubo). 

En general, si hay k factores, cada uno con dos niveles, el diseno factorial requeriria 2 k corridas. Por 
ejemplo, el experimento de la figura 1-7 requiere 16 corridas. Evidentemente, cuando el numero de facto- 
res de interns aumenta, el numero de corridas requeridas se incrementa con rapidez; por ejemplo, un 
experimento con 10 factores en el que todos los factores tienen dos niveles requeriria 1024 corridas. Esto 
pronto se vuelve impracticable en lo que se refiere al tiempo y los recursos. En el experimento del golf, 
el autor sdlo puede jugar ocho rondas, por lo que incluso el experimento de la figura 1-7 resulta demasia- 
do largo. 

Por fortuna, cuando se trabaja con cuatro, cinco o mas factores, por lo general no es necesario probar 
todas las combinaciones posibles de los niveles de los factores. Un experimento factorial fraccionado es 
una variation del diseno factorial basico en la que s61o se realiza un subconjunto de las corridas. En la fi- 
gura 1-8 se ilustra un diseno factorial fraccionado para la version de cuatro factores del experimento del 
golf. Este diseno requiere s61o 8 corridas en lugar de las 16 originates y se Uamaria fraccion un medio. Si el 
autor sdlo puede jugar ocho rondas de golf, este es un excelente diseno en el cual estudiar los cuatro facto- 
res. Proportional informacidn adecuada acerca de los efectos principals de los cuatro factores, asi 
como cierta information acerca de la forma en que interactuan estos factores. 

Los disenos factorials fraccionados son muy comunes en la investigacidn y el desarrollo industrial, 
asi como en el mejoramiento de procesos. Estos disenos se analizariin en el capitulo 8. 
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Figura 1-8 Experimento factorial fraccionado de cuatro factores que incluye 
el tipo de palo, el tipo de pelota, el tipo de bebida y la manera de desplazarse. 
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U2 ALGUNAS APLICACIONES TIPICAS DEL DISENO EXPERIMENTAL 

Los metodos del diseno experimental han encontrado amplia aplicaci6n en diversas disciplinas. De he- 
cho, la experimentation puede considerarse parte del proceso cientifico y uno de los medios para conocer 
el funcionamiento de sistemas y procesos. En general, el aprendizaje ocurre a trav£s de una serie de acti- 
vidades en las que se hacen conjeturas acerca de un proceso, se llevan a cabo experimentos para generar 
dates del proceso y despues se usa la information del experimento para establecer nuevas conjeturas, lo 
que lleva a nuevos experimentos, y asi sucesivamente. 

El diseno experimental es una herramienta de importancia fundamental en el dmbito de la ingenieria 
para mejorar el desempeno de un proceso de manufactura. Thmbien tiene multiples aplicaciones en el de- 
sarrollo de procesos nuevos. La aplicacion de las t6cnicas del diseno experimental en las fases initiates del 
desarrollo de un proceso puede redundar en 

1. Mejoras en el rendimiento del proceso. 

2. Variabilidad reducida y conformidad mas cercana con los requeriinientos noininales o proyectados. 

3. Reduccion del tiempo de desarrollo. 

4. Reduccion de los costos globales. 

Los metodos del diseno experimental desempenan tambien un papel importante en las actividades 
del diseno de ingenieria, donde se desarrollan productos nuevos y se hacen mejoramientos en los produc- 
tos existentes. Entre las aplicaciones del diseno experimental en el diseno de ingenieria se encuentran: 

1. La evaluacidn y comparacion de configuraciones de disehos basicos. 

2. La evaluation de materiales altemativos. 

3. La selection de los parametros del diseno para que el producto tenga un buen funcionamiento en 
una amplia variedad de condiciones de campo, es decir, para que el producto sea robusto. 

4. La determination de los parametros clave del diseno del producto que afectan el desempeno del 
mismo, 

El uso del diseno experimental en estas areas puede redundar en productos cuya fabricacion sea mas sen- 
cilla, en productos que tengan un desempeno y confiabilidad de campo mejorados, en costos de produc- 
tion mas bajos y en tiempos mas cortos para el diseno y desarrollo del producto. A continuacidn se 
presentan varios ejemplos que ilustran algunas de estas ideas. 


EJEMPLO M * 

Caracterizacion de un proceso 

En el proceso de fabricacion de tarjetas de circuitos impresos se utiliza una maquina de soldadura liquida. 
La maquina limpia las taijetas en un fundente, las somete a un proceso de precalentamiento y despues las 
hace pasar por una onda de soldadura liquida mediante una transportadora. En este proceso de soldadu- 
ra se hacen las conexiones electricas y mec£nicas de los componentes recubiertos de plomo en la tarjeta. 

El proceso opera actualmente con un nivel de defectos aproximado de 1 %. Es decir, cerca de 1 % de 
las juntas de soldadura de una tarjeta son defectuosas y requieren correction manual. Sin embargo, debi- 
do a que la tarjeta de circuitos impresos promedio contiene mas de 2000 juntas de soldadura, incluso un 
nivel de defectos de 1% representa un mimero demasiado alto de juntas de soldadura que requieren co- 
rreccidn. A1 ingeniero responsable del proceso en esta &rea le gustaria usar un experimento disenado 
para determinar cuales son los parametros de la m&quina que influyen en la ocurrencia de los defectos de 
soldadura y que ajustes deberian hacerse en dichas variables para reducir los defectos de soldadura. 
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En la m&quina de soldadura llquida hay diversas variables que pueden controlarse. Estas incluyen: 

1. La temperatura de la soldadura. 

2. La temperatura del precalentamiento. 

3. La velocidad de la transportadora. 

4. El tipo de fundente. 

5. La gravedad especifica del fundente. 

6. La profundidad de la onda de soldadura. 

7. El angulo de la transportadora. 

Adem&s de estos factores controlables, hay otros que no es sencillo manejar durante el proceso de fabri- 
cation, aunque podrian controlarse para los fines de una prueba. Estos son: 

1. El espesor de la tarjeta de circuitos impresos. 

2. El tipo de componentes usados en la tarjeta. 

3. La disposition de los componentes en la tarjeta. 

4. El operador. 

5. La rapidez de production. 

En esta situacidn, el interns del ingeniero es caracterizar la mdquina de soldadura liquida; es decir, 
quiere determinar los factores (tanto los controlables como los no controlables) que afectan la ocurrencia 
de defectos en las tarjetas de circuitos impresos. Para ello puede disenar un experimento que le permitira 
estimar la magnitud y direccidn de los efectos de los factores; es decir, cu&nto cambia la variable de res- 
puesta (defectos por unidad) cuando se modifica cada factor, y si la modificatidn de los factores en con- 
junto produce resultados diferentes que los obtenidos mediante el ajuste individual de los factores; es 
decir, iexiste interaction entre los factores? En ocasiones a un experimento como 6ste se le llama experi- 
mento tamiz o de exploracidn exhaustiva. De manera tipica, los experimentos tamiz incluyen el uso de di- 
sehos factorials fraccionados, como en el ejemplo del golf de la figura 1-8. 

La information obtenida de este experimento tamiz se usar£ para identificar los factores criticos del 
proceso y determinar la direction del ajuste de dichos factores a fin de conseguir una reduccidn adicional 
del numero de defectos por unidad. El experimento tambidn puede proporcionar information acerca de 
los factores que deberian controlarse con mayor atencidn durante el proceso de fabricacidn a fin de evi- 
tar los niveles elevados de defectos y el desempeno err£tico del proceso. Por lo tanto, una consecuencia 
del experimento podria ser la aplicacion de t^cnicas como las cartas de control a una o mas de las varia- 
bles del proceso (la temperatura de la soldadura, por ejemplo), aunadas a las cartas de control de la pro- 
duccidn del proceso. Con el tiempo, si se consigue una mejoria sensible del proceso, quiza sea posible 
basar la mayor parte del programa de control del mismo en el control de las variables de entrada del pro- 
ceso en lugar de aplicar cartas de control a la produccidn. 


EJEMPLO V2 

Optimization de un proceso 

En un experimento de caracterizacidn, el interds suele centrarse en determinar las variables del proceso 
que afectan la respuesta. El siguiente paso ldgico es la optimization, es decir, determinar la regidn de los 
factores importantes que conduzca a la mejor respuesta posible, Por ejemplo, si la respuesta es el rendi- 
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miento, se buscarfa la region del rendimiento m£ximo, mientras que si la respuesta es la variabilidad de 
una dimensibn critica del producto, se buscarfa una regibn de variabilidad minima. 

Supongamos que el interes se centra en mejorar el rendimiento de un proceso quimico. Por los resul- 
tados de un experimento de caracterizacibn se sabe que las dos variables mas importantes del proceso que 
influyen en el rendimiento son la temperatura de operacion y el tiempo de reaccibn. El proceso opera ac- 
tualmente a 145°F y con 2.1 horas de tiempo de reaccibn, produciendo rendimientos de cerca de 80%. En 
la figura 1-9 se muestra una vista desde arriba de la regibn tiempo-temperatura. En esta grafica las lineas 
de rendimiento constante se unen para formar los contomos de respuesta, y se muestran las lineas de con- 
torno para rendimientos de 60, 70, 80, 90 y 95 por ciento. Estos contornos son las proyecciones en la re- 
gion tiempo-temperatura de las secciones transversales de la superficie del rendimiento correspondiente 
a los rendimientos porcentuales arriba mencionados. A esta superficie se le llama en ocasiones superficie 
de respuesta. El personal del proceso no conoce la verdadera superficie de respuesta de la figura 1-9, por 
lo que se necesitaran metodos experimentales para optimizar el rendimiento con respecto al tiempo y la 
temperatura. 

Para localizar el rendimiento optimo, es necesario llevar a cabo un experimento en el que se hagan 
variar conjuntamente el tiempo y la temperatura, es decir, un experimento factorial. En la figura 1-9 se 
muestran los resultados de un experimento factorial inicial realizado con dos niveles tanto del tiempo 
como de la temperatura. Las respuestas que se observan en los cuatro vertices del cuadrado indican que, 
para incrementar el rendimiento, los cambios deberian hacerse en la direccibn general del aumento de la 



Figura 1-9 Grafica de contorno del rendimiento como una fun- 
cidn del tiempo de reaccion y la temperatura de reaccidn, la cual 
ilustra la experimentacidn para optimizar un proceso. 
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temperaturay la reduccidn del tiempo de reaction. Se realizarfan algunas corridas adicionales en esta di- 
reccidn, y esta experimentacidn adicional llevaria a la region del rendimiento maximo. 

Una vez que se ha encontrado la region del rendi m iento dptimo, el siguiente paso tfpico seria realizar 
un segundo experimento. El objetivo de este segundo experimento es desarrollar un modelo empirico del 
proceso y obtener una estimacidn mis precisa de las condiciones de operation optimas para el tiempo y la 
temperatura. A este enfoque para la optimizacion de un proceso se le llama la metodologfa de superficies 
de respuesta, la cual se examina en detalle en el capftulo 11. El segundo diseno ilustrado en la figura 1-9 es 
un diseno central compuesto, uno de los diseiios experimentales mas importantes que se usan en los estu- 
dios de optimizacion de procesos. 


EJEMPLO 1-3 

Ilustracion del diseno de un producto 

Con frecuencia los mdtodos de diseno experimental pueden aplicarse en el proceso de diseno de un pro- 
ducto. Para ilustrar esto, suponga que un grupo de ingenieros esta disenando el gozne de la puerta de un 
automovil. La caracteristica de calidad del producto que les interesa es el esfuerzo amortiguador, es de- 
cir, la capacidad de retencidn del tope que impide que la puerta se cierre cuando el vehiculo se estaciona 
en una pendiente. El mecanismo amortiguador consta de un resorte de hojas y un cilindro. Cuando la 
puerta se abre, el cilindro se desplaza por un arco que hace que el resorte de hojas se comprima. Para ce- 
rrar la puerta es necesario veneer la fuerza del resorte, la cual produce el esfuerzo amortiguador. El equi- 
po de ingenieros considera que el esfuerzo amortiguador es una funcidn de los siguientes factores: 

1. La distancia que se desplaza el cilindro. 

2 . La altura del resorte del pivote a la base. 

3. La distancia horizontal del pivote al resorte. 

4. La altura libre del resorte auxiliar. 

5. La altura libre del resorte principal. 

Los ingenieros pueden construir un prototipo del mecanismo del gozne en el que es posible variar to- 
dos estos factores dentro de ciertos rangos. Una vez que se han identificado los niveles apropiados de es- 
tos cinco factores, puede disenarse un experimento que conste de varias combinaciones de los niveles de 
los factores, y el prototipo del gozne puede probarse con estas combinaciones. Se obtendra asi informa- 
ci6n respecto de los factores que tienen una mayor influencia sobre el esfuerzo amortiguador del tope y, 
mediante el an&lisis de esta informacidn, podra mejorarse el diseno del tope. 


1-3 PRINCIPIOS BASICOS 

Si quiere llevarse a cabo un experimento como los descritos en los ejemplos 1-1 al 1-3 con la mayor efi- 
ciencia posible, es necesario utilizar un enfoque cientifico para planearlo. El diseno estadlstico de experi- 
mentos se refiere al proceso para planear el experimento de tal forma que se recaben datos adecuados 
que puedan analizarse con metodos estadisticos que lie varan a conclusiones validas y objetivas. El enfo- 
que estadlstico del diseno experimental es necesario si se quieren sacar conclusiones significativas de los 
datos. Cuando el problema incluye datos que est<m sujetos a errores experimentales, la metodologia esta- 
dfstica es el unico enfoque objetivo de amilisis. Por lo tanto, cualquier problema experimental incluye dos 
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aspectos: el diseno del experimento y el analisis estadistico de los datos. Estos dos aspectos se encuentran 
intimamente relacionados porque el metodo de analisis depende directamente del diseno empleado. 
Ambos temas se tratan en este libro. 

Los tres principios basicos del diseno experimental son la realizacion de replicas, la aleatorizacion y 
la formation de bloques. Por realization de replicas se entiende la repetition del experimento basico. En 
el experimento metalurgico analizado en la section 1-1, una replica consistiria en el tratamiento de una 
muestra con el templado en aceite y el tratamiento de una muestra con el templado en agua salada. Por lo 
tanto, si se tratan cinco ejemplares en cada medio de templado, se dice que se han obtenido cinco repli- 
cas. La realizacion de replicas posee dos propiedades importantes. Primera, permite al experimentador 
obtener una estimacion del error experimental. Esta estimation del error se convierte en una unidad de 
medicion basica para determinar si las diferencias observadas en los datos son en realidad estadisticamen- 
te diferentes. Segunda, si se usa la media muestral (por ejemplo, y) para estimar el efecto de un factor en 
el experimento, la realization de replicas permite al experimentador obtener una estimacion mas precisa 
de este efecto. Por ejemplo, si o 2 es la varianza de una observacidn individual y hay n replicas, la varianza 
de la media muestral es 



La consecuencia practica de lo anterior es que si se hicieron n = 1 replicas y se observoyj = 145 (tem- 
plado en aceite) y y 2 = 147 (templado en agua salada), probablemente no podran hacerse inferencias satis- 
factorias acerca del efecto del medio de templado; es decir, la diferencia observada podria ser resultado del 
error experimental. Por otra parte, si n fue razonablemente grande y el error experimental fue lo suficiente- 
mente pequeno, y se observoyj < y 2 , podria concluirse con una certeza razonable que el templado en agua 
salada produce una dureza mayor en esta aleacidn de aluminio particular que el templado en aceite. 

Hay una diferencia importante entre replicas y mediciones repetidas. Por ejemplo, suponga que una 
oblea de silicio se graba con un proceso de grabado quimico con plasma para oblea unica, y que se hacen 
tres mediciones de una dimension critica de esta oblea. Estas mediciones no son replicas; son una forma 
de mediciones repetidas y, en este caso, la variabilidad observada en las tres mediciones repetidas es reflejo 
directo de la variabilidad inherente del sistema o instrumento de medicion. Como otro ejemplo, suponga 
que, como parte de un experimento en la manufactura de semiconductores, se procesan simultaneamente 
cuatro obleas en un homo de oxidation con una velocidad del flujo de gas y un tiempo particulares y que 
se hace despues una medicion del espesor del 6xido en cada oblea. De nueva cuenta, la medicion de las 
cuatro obleas no son replicas sino mediciones repetidas. En este caso reflejan las diferencias entre las 
obleas y otras fuentes de variabilidad dentro de esa operation de homeado particular. En las replicas se 
reflejan las fuentes de variabilidad tanto entre las corridas como (potencialmente) dentro de las mismas. 

La aleatorizacion es la piedra angular en la que se fundamenta el uso de los metodos estadisticos en 
el diseno experimental. Por aleatorizacion se entiende que tanto la asignacidn del material experimental 
como el orden en que se realizaran las corridas o ensayos individuates del experimento se determinan al 
azar. Uno de los requisites de los metodos estadisticos es que las observaciones (o los errores) sean varia- 
bles aleatorias con distributiones independientes. La aleatorizacion hace por lo general que este supues- 
to sea valido. La aleatorizacidn correcta del experimento ayuda tambien a “sacar del promedio” los 
efectos de factores extranos que pudieran estar presentes. Por ejemplo, suponga que los ejemplares del 
experimento descrito antes presentan sdlo ligeras diferencias en el espesor y que la efectividad del medio 
de templado puede ser afectado por el espesor del ejemplar. Si todos los ejemplares sometidos al templa- 
do en aceite son mds gruesos que los sometidos al templado en agua salada, quiza se este introduciendo 
un sesgo sistematico eri los resultados experimentales. Este sesgo estorba en uno de los medios de templa- 
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do y, en consecuencia, invalida los resultados obtenidos. A1 hacer la asignacidn aleatoria de los ejempla- 
res al medio de templado este problema se aligera en parte, 

Es muy comun el uso de programas de computadora para auxiliar a los experimentadores a seleccio- 
nar y construir disenos experimentales. Estos programas presentan a menudo las corridas del diseno ex- 
perimental de manera aleatoria. Por lo general este modo aleatorio se crea utilizando un generador de 
numeros aleatorios. Incluso con estos programas de computadora, con frecuencia seguira siendo necesa- 
rio que el experimentador haga la asignacion del material experimental (como las obleas en los ejemplos 
de semiconductores mencionados antes), de los operadores, de los instrumentos o herramientas de medi- 
cion, etc., que se utilizaran en el experimento. Puede recurrirse a tablas de numeros aleatorios para ase- 
gurar que las asignaciones se hacen al azar, 

En ocasiones los experimentadores se encuentran con situaciones en las que la aleatorizacion de un 
aspecto del experimento es complicada. Por ejemplo, en un proceso quimico, la temperatura puede ser 
una variable muy dificil de modificar, haciendo casi imposible la aleatorizacibn completa de este factor. 
Existen metodos de diseno estadistico para resolver las restricciones sobre la aleatorizacion. Algunos de 
estos enfoques se revisaran en capitulos subsecuentes (ver en particular el capitulo 13). 

La formation de bloques es una tecnica de diseno que se utiliza para mejorar la precision de las com- 
paradones que se hacen entre los factores de interes. Muchas veces la formacion de bloques se emplea 
para reducir o eliminar la variabilidad transmitida por factores perturbadores; es decir, aquellos factores 
que pueden influir en la respuesta experimental pero en los que no hay un interes especifico. Por ejemplo, 
en un experimento de un proceso quimico pueden requerirse dos lotes de materia prima para realizar to- 
das las corridas necesarias. Sin embargo, podria haber diferencias entre los lotes debido a la variabilidad 
de un proveedor a otro y, en caso de no haber un interes especifico en este efecto, los lotes de materia pri- 
ma se considerarian un factor perturbador. En general, un bloque es un conjunto de conditiones experi- 
mentales relativamente homogeneas, En el ejemplo del proceso quimico, cada lote de materia prima 
formaria un bloque, ya que es de esperarse que la variabilidad dentro de un lote sea menor que la variabi- 
lidad entre lotes. De manera tipica, como en este ejemplo, cada nivel del factor perturbador pasa a ser un 
bloque. Entonces el experimentador divide las observaciones del diseno estadistico en grupos que se co- 
rren en cada bloque. En varias partes del texto se estudia en detalle la formacion de bloques, incluyendo 
los capitulos 4, 5, 7, 8, 9, 11 y 13. En el capitulo 2, section 2-5.1, se presenta un ejemplo sencillo para ilus- 
trar la estructura basica de la formacion de bloques. 

Los tres principios basicos del diseno experimental, la aleatorizacidn, la realization de replicas y la 
formacion de bloques son parte de cada uno de los experimentos. Se ilustraran y resaltaran repetidamen- 
te a lo largo de este libro. 


U4 PAUTAS GENERALES PARA DISENAR EXPERIMENTOS 

Para aplicar el enfoque estadistico en el diseno y analisis de un experimento, es necesario que todos los 
que participan en el mismo tengan desde el principio una idea clara de qu6 es exactamente lo que va a es- 
tudiarse, como van a colectarse los datos, y al menos una comprension cualitativa de la forma en que van a 
analizarse estos datos. En la tabla 1-1 se muestra un esquema general del procedimiento recomendado. A 
continuation se presenta una breve explication de este esquema y se elaboran algunos de los puntos cla- 
ve. Para mayores detalles, ver Coleman y Montgomery [27], asi como las referencias al final del libro, 
Thmbien es util el material complementario para este capitulo. 

1. Identification y enunciation del problema. Este punto podria parecer muy obvio, pero es comun que 
en la practica no sea sencillo darse cuenta de que existe un problema que requiere experimentacidn, y 
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Tabla 1-1 Pautas generales para disenar un experimento 


1. Identificaci6n y exposition del problema. 

2. Election de los factores, los niveles y los ranges/' 

3. Seleccidn de la variable de respuesta. 11 

4. Election del diseno experimental. 

5. Realizacidn del experimento. 

6. AnAlisis estadistico de los datos. 

7. Conclusiones y recomendaciones. 


Planeacidn previa 
al experimento 


° En la practica, los pasos 2 y 3 suelen hacerse simultaneamente o en el orden inverso. 


tampoco es facil desarrollar una enunciacion clara, con la que todos esten de acuerdo, de este problema. 
Es necesario desarrollar todas las ideas acerca de los objetivos del experimento. Generalmente, es impor- 
tante solicitar aportaciones de todas las Areas involucradas: ingenieria, aseguramiento de calidad, manu- 
factura, raercadotecnia, administracidn, el cliente y el personal de operacion (el cual por lo general 
conoce a fondo el proceso y al que con demasiada frecuencia se ignora). Por esta razdn, se recomienda un 
enfoque de equipo para disenar experimentos. 

En la mayoria de los casos es conveniente hacer una lista de los problemas o las preguntas especificas 
que van a abordarse en el experimento. Una enunciacion clara del problema contribuye sustancialmente 
a menudo para alcanzar una mejor comprensidn de los fendmenos bajo estudio y la solution final del pro- 
blema. Tkmbien es importante tener presente el objetivo global; por ejemplo, <’.se trata de un proceso o 
sistema nuevo (en cuyo caso el objetivo inicial posiblemente serA la caracterizacion o tamizado de los fac- 
tores) o se trata de un sistema maduro que se conoce con profundidad razonable y que se ha caracterizado 
con anterioridad (en cuyo caso el objetivo puede ser la optimization)? En un experimento puede haber 
muchos objetivos posibles, incluyendo la confirmacidn (/.el sistema se comporta de la misma manera aho- 
ra que en el pasado?), el descubrimiento (cque ocurre si se exploran nuevos materiales, variables, condi- 
ciones de operacion, etc.?) y la estabilidad (ibajo qud condiciones las Variables de respuesta de interns 
sufren una degradation seria?). Obviamente, las cuestiones especificas que habran de abordarse en el ex- 
perimento se relacionan de manera directa con los objetivos globales. Con frecuencia en esta etapa de la 
formulacidn del problema muchos ingenieros y cientificos se percatan de que no es posible que un experi- 
mento comprensivo extenso responda las cuestiones clave y de que un enfoque secuencial en el que se uti- 
lice una serie de experimentos mas pequenos es una estrategia mAs adecuada. 

2. Eleccidn de los factores, los niveles y los rangos. (Como se indica en la tabla 1-1, los pasos 2 y 3 mu- 
chas veces se hacen simultaneamente o en orden inverso.) Cuando se consideran los factores que pueden 
influir en el desempeno de un proceso o sistema, el experimentador suele descubrir que estos factores 
pueden clasificarse como factores potenciales del diseno o bien como factores perturbadores. Los facto- 
res potenciales del diseno son aquellos que el experimentador posiblemente quiera hacer variar en el ex- 
perimento. Es frecuente encontrar que hay muchos factores potenciales del diseno, por lo que es 
conveniente contar con alguna clasificacion adicional de los mismos. Algunas clasificaciones utiles son 
factores del diseno, factores que se mantienen constantes y factores a los que se permite variar. Los facto- 
res del diseno son los que se seleccionan realmente para estudiarlos en el experimento. Los factores que 
se mantienen constantes son variables que pueden tener cierto efecto sobre la respuesta, pero que para 
los fines del experimento en curso no son de interes, por lo que se mantendrAn fijos en un nivel especifico. 
Por ejemplo, en un experimento de grabado quimico en la industria de los semiconductores puede haber 
un efecto, que es unico, de la herramienta especifica para el grabado quimico con plasma que se utiliza en 
el experimento. Sin embargo, seria muy dificil variar este factor en un experimento, por lo que el experi- 
mentador puede decidir llevar a cabo todas las corridas experimentales en un grabador quimico particu- 
lar (idealmente “tipico”). De este modo, este factor se mantiene constante. Como un ejemplo de factores 
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a los que se permite variar, las unidades experimentales o los “materiales” a los que se aplican los factores 
del diseno no son homog6neos por lo general, no obstante lo cual con frecuencia se ignora esta variabili- 
dad de una unidad a otra y se comfia en la aleato rizacidn para compensar cualquier efecto del material o la 
unidad experimental. Muchas veces se trabajard con el supuesto de que los efectos de los factores que se 
mantienen constantes y de los factores a los que se permite variar son relativamente pequenos. 

Por otra parte, los factores perturbadores pueden tener efectos considerables que deben tomarse en 
consideration, a pesar de que no haya interns en ellos en el contexto del experimento en curso. Los factores 
perturbadores suelen clasificarse como factores controlables, no controlables o de ruido. Un factor pertur- 
bador controlable es aquel cuyos niveles pueden ser ajustados por el experimentador. Por ejemplo, el expe- 
rimentador puede seleccionar lotes diferentes de materia prima o diversos dias de la semana para conducir 
el experimento. La estructura basica de la formacidn de bloques, comentada en la seccidn anterior, suele ser 
util para trabajar con factores perturbadores controlables. Si un factor perturbador no es controlable en el 
experimento, pero puede medirse, muchas veces puede usarse el procedimiento de an&lisis denominado 
analisis de covarianza para compensar este efecto. Por ejemplo, la humedad relativa en el medio ambiente 
del proceso puede afectar el desempeno del proceso, y si la humedad no puede controlarse, probablemente 
podrii medirse y tratarse como una covariable. Cuando un factor que varia de manera natural y no controla- 
ble en el proceso puede controlarse para los fines de un experimento, con frecuencia se le llama factor de 
ruido. En tales situaciones, es comun que el objetivo sea encontrar los ajustes de los factores controlables 
del diseno que minimicen la variabilidad transmitida por los factores de ruido. En ocasiones a esto se le lla- 
ma el estudio de robustez del proceso o el problema de robustez del diseno. La formatidn de bloques, el 
analisis de covarianza y los estudios de robustez del proceso se comentan mas adelante. 

Una vez que el experimentador ha seleccionado los factores del diseno, debe elegir los rangos en los 
que hard variar estos factores, asi como los niveles especificos con los que se realizar&n las corridas, Thm- 
bi6n deberi pensarse cdmo van a controlarse estos factores en los valores deseados y c6mo van a medirse. 
Por ejemplo, en el experimento de la soldadura liquida, el ingeniero ha definido 12 variables que pueden 
afectar la ocurrencia de defectos de soldadura. El ingeniero tambidn tendril que tomar una decisidn en 
cuanto a la regidn de interns para cada variable (es decir, el rango en el que se hard variar cada factor) y 
en cuanto al numero de niveles de cada variable que usara. Para ello se requiere del conocimiento del proce- 
so. Este conocimiento del proceso suele ser una combinacidn de experiencia prdctica y conocimientos teori- 
cos. Es importante investigar todos los factores que pueden ser de importancia y no dejarse influir 
demasiado por la experiencia pasada, en particular cuando uno se encuentra en las fases iniciales de la expe- 
rimentacidn o cuando el proceso no estd del todo maduro. 

Cuando el objetivo del experimento es el tamizado de los factores o caracterizacidn del proceso, por lo 
general es mejor mantener redutido el numero de niveles de los factores. En general, dos niveles funcionan 
bastante bien en los estudios de tamizado de factores, Elegir la regidn de inter6s tambi£n es importante. En el 
tamizado de factores, la regidn de interns debera ser relativamente grande; es decir, el rango en el que se ha- 
cen variar los factores deberii ser amplio, Conforme se sepa m&s acerca de las variables que son importantes y 
de los niveles que producen los mejores resultados, la regidn de interns se hara por lo general m&s estrecha, 

3. Seleccidn de la variable de respuesta. Para seleccionar la variable de respuesta, el experimentador de- 
berii tener la certeza de que esta variable proporciona en realidad informacidn util acerca del proceso bajo 
estudio. En la may on a de los cases, el promedio o la desviatidn estandar (o ambos) de la caracteristica me- 
dida serii la variable de respuesta. No son la excepcidn las respuestas multiples. La eficiencia de los instru- 
ments de medicidn (o error de medicidn) tambi6n es un factor importante. Si la eficiencia de los 
instruments de medicidn es inadecuada, el experimentador s61o detectarii los efectos relativamente gran- 
des de los factores o quiz£ sean necesarias replicas adicionales, En algunas situaciones en que la eficiencia 
de los instruments de medicidn es pobre, el experimentador puede decidir medir varias veces cada unidad 
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experimental y usar el promedio de las mediciones repetidas como respuesta observada. Suele ser de impor- 
tancia determinante identificar los aspectos relacionados con la definicidn de las respuestas de interns y c6mo 
van a medirse antes de llevar a cabo el experimento. En ocasiones se emplean experimentos disenados para 
estudiar y mejorar el desempeiio de los sistemas de medition. Para un ejemplo, ver el capitulo 12. 

Se reitera lo crucial que es exponer todos los puntos de vista y la information del proceso en los pasos 
1 al 3 anteriores. Se hace referencia a esto como plantation previa al experimento. Coleman y Montgo- 
mery [27] proporcionan hojas de trabajo que pueden ser utiles en la planeacion previa al experimento. 
Vease tambien la information complementaria del texto para mas detalles y un ejemplo del uso de estas 
hojas de trabajo. En muchas situaciones, no es posible que una sola persona posea todos los conocimien- 
tos requeridos para hacer esto adecuadamente. Por lo tanto, se hace una amplia recomendacion para el 
trabajo en equipo durante la planeacion del experimento. La mayor parte del exito gravitara en tomo a 
que tan bien se haya hecho la planeacion previa del experimento. 

4. Eleccidn del diseno experimental Si las actividades de planeacion previas al experimento se realizan 
como es debido, este paso es relativamente sencillo. La election del diseno implica la consideracion del 
tamano de la muestra (numero de replicas), la selection de un orden de corridas adecuado para los ensa- 
yos experimentales y la determinacibn de si entran en juego o no la formation de bloques u otras restric- 
ciones sobre la aleatorizacion. En este libro se revisan algunos de los tipos mas importantes de disenos 
experimentales, y puede usarse en ultima instancia como un catalogo para seleccionar el diseno experi- 
mental apropiado para una amplia variedad de problemas. 

Existen tambien varios paquetes interactivos de software de estadistica que soportan esta fase del di- 
seno experimental. El experimentador puede introducir la informacion del numero de factores, los nive- 
les y los rangos, y estos programas presentaran a la consideracion del experimentador una seleccion de 
disenos o recomendar&n un diseno particular. (Nosotros preferimos ver varias alternativas en lugar de 
confiar en la recomendacion de la computadora en la mayoria de los casos.) Estos programas proporcio- 
nan tambien por lo general una hoja de trabajo (con el orden aleatorizado de las corridas) que se usard en 
la conduccibn del experimento. 

Al seleccionar el diseno, es importante tener en mente los objetivos experimentales. En muchos ex- 
perimentos de ingenieria se sabe de antemano que algunos de los niveles de los factores produciran valo- 
res diferentes de la respuesta. En consecuencia, el interns se centra en identificar que factores causan esta 
diferencia y en estimar la magnitud del cambio de la respuesta. En otras situaciones podrfa haber mas in- 
terns en verificar la uniformidad. Por ejemplo, pueden compararse dos condiciones de production Ay B, 
donde A es el esiandar y B es una alternativa con una eficiencia de costos mayor. El experimentador esta- 
r & interesado entonces en demostrar que, por ejemplo, no hay ninguna diferencia en el rendimiento entre 
las dos condiciones. 

5. ReaUzacidn del experimento. Cuando se lleva a cabo el experimento es vital monitorear con atencion el 
proceso a fin de asegurarse de que todo se este haciendo conforme a la planeacion. Los errores en el proce- 
dimiento experimental en esta etapa destruiran por lo general la validez experimental. Poner en un primer 
piano la planeacion es crucial para el cxito. Es facil subestimar los aspectos de logistica y planeacion cuando 
se corre un experimento disenado en un ambiente complejo de manufactura o de investigation y desarrollo. 

Coleman y Montgomery [27] sugieren que antes de llevar a cabo el experimento, es conveniente en 
muchas ocasiones realizar algunas corridas piloto o de prueba. Estas corridas proporcionan informa- 
cion acerca de la consistencia del material experimental, una comprobacion del sistema de medicibn, 
una idea aproximada del error experimental y la oportunidad de poner en practica la tecnica experi- 
mental global. Esto ofrece tambien una oportunidad para revisar, de ser necesario, las decisiones toma- 
das en los pasos 1 al 4. 
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6. Andlisis estadistico de los datos. Deberan usarse ntetodos estadisticos para analizar los datos a fin de 
que los resultados y las conclusiones sean objetivos y no de caracter apreciativo. Si el experimento se ha 
disenado correctamente y si se ha llevado a cabo de acuerdo con el diseno, los ntetodos estadisticos nece- 
sarios no deben ser complicados. Existen varios paquetes de software excelentes disenados para auxiliar 
en el andlisis de datos, y muchos de los programas usados en el paso 4 para seleccionar el diseho cuentan 
con una interfase directa para el andlisis estadistico. Con frecuencia se encuentra que los ntetodos grafi- 
cos simples desempenan un papel importante en el andlisis e interpretacion de datos. Debido a que mu- 
chas de las preguntas que el experimentador quiere responder pueden insertarse en el marco de la prueba 
de hipdtesis, los procedimientos para probar hipotesis y estimar intervalos de confianza son muy utiles en 
el andlisis de datos de un experimento disenado. Muchas veces es muy util tambten presentar los resulta- 
dos de varios experimentos en thrminos de un modelo empirico, es decir, mediante una ecuacidn derivada 
de los datos que expresa la relacidn entre la respuesta y los factores importantes del diseho. El andlisis re- 
sidual y la verificacidn de la adecuacidn del modelo son tambten tecnicas de analisis importantes. Mas 
adelante se revisaran en detalle estos temas. 

Recuerde que los ntetodos estadisticos no pueden demostrar que un factor (o factores) posee un 
efecto particular, s61o proporcionan pautas generates en cuanto a la confiabilidad y la validez de los resul- 
tados. Aplicados en forma correcta, los metodos estadisticos no permiten la demostracidn experimental 
de nada, pero si sirven para medir el error posible en una conclusidn o asignar un nivel de confianza a un 
enunciado. La ventaja principal de los ntetodos estadisticos es que agregan objetividad al proceso de 
toma de decisiones. Las tdcnicas estadisticas, aunadas a unabuena ingenieria o conocimiento del proceso 
y el sentido comun, llevarhn por lo general a conclusiones sdlidas. 

7. Conclusiones y recomendaciones. Una vez que se han analizado los datos, el experimentador debe sacar 
conclusiones prdcticas acerca de los resultados y recomendar un curso de action. Los metodos grhficos sue- 
len ser utiles en esta etapa, en particular para presentar los resultados. Thmbten deberan realizarse corridas 
de seguimiento o pruebas de confirmation para validar las conclusiones del experimento. 

A lo largo del proceso completo es importante tener presente que la experimentacidn es una parte 
esencial del proceso de aprendizaje, en la que se formulan hipotesis tentativas acerca de un sistema, se 
realizan experimentos para investigar estas hipdtesis y se formulan nuevas hipdtesis con base en los resul- 
tados, y asi sucesivamente. Esto sugiere que la experimentacidn es iterativa. Por lo general es un gran 
error disenar un solo experimento comprensivo y extenso al principio de un estudio. Un experimento exi- 
toso requiere conocer los factores importantes, los rangos en los que deberdn hacerse variar estos facto- 
res, el numero apropiado de niveles que deber&n usarse y las unidades de medicidn apropiadas para estas 
variables. En general, no se conocen las respuestas precisas de estas cuestiones, pero se aprende acerca de 
ellas sobre la marcha. A medida que avanza un programa experimental, es comun abandonar algunas va- 
riables de entrada e incorporar otras, modificar la region de exploracidn de algunos factores o incorporar 
nuevas variables de respuesta. Por consiguiente, generalmente la experimentacten se hace en forma se- 
cuencial y, como regia general, no deberh invertirse mas de 25% de los recursos disponibles en el primer 
experimento. Con esto se asegurarh que se contar& con los recursos suficientes para realizar las corridas 
de confirmacidn y que se alcanzarh en tiltima instancia el objetivo final del experimento. 


1-5 BREVE HISTORIA DEL DISENO ESTADISTICO 

Ha habido cuatro eras del desarrollo modemo del diseho experimental estadistico. La era agricola fue 
encabezada por el trabajo pionero de Sir Ronald A. Fisher en los anos 1920 y principios de la decada de 
1930. En este periodo, Fisher fue el responsable de las estadisticas y el anhlisis de datos en la Estacion 
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Agricola Experimental de Rothamsted en las cercanias de Londres, Inglaterra. Fisher se percato de que 
las fallas en la forma en que se llevaba a cabo el experimento que generaba los datos obstac uliz aban con 
frecuencia el analisis de los datos de los sistemas (en este caso sistemas agricolas). Mediante la interac- 
cidn con multiples cientificos e investigadores de diversos campos, Fisher desarrolld las ideas que lleva- 
ron a los tres principios bhsicos del diseho experimental que se revisan en la seccion 1-3: la aleatorizacidn, 
la realizacion de replicas y la formation de bloques. Fisher incorpord de manera sistematica pi pensa- 
miento y los principios estadisticos en el diseho de las investigaciones experimentales, incluyendo el con- 
cepto de diseno factorial y el anhlisis de varianza. Sus libros [44a, b] tuvieron profunda influencia en el uso 
de la estadistica, particularmente en la agricultura y las ciencias bioldgicas relacionadas. Para una exce- 
lente biografia de Fisher, ver Box [21], 

Si bien es cierto que la aplicacidn del diseho estadistico en ambientes industriales se initio en la ddca- 
da de 1930, el catalizador de la segunda era, o era industrial, fue el desarrollo de la metodologia de super- 
ficies de respuesta (MSR) por parte de Box y Wilson [20]. Estos autores se percataron y explotaron el 
hecho de que muchos experimentos industriales son fundamentalmente diferentes de sus contrapartes 
agricolas en dos sentidos: 1) la variable de respuesta puede observarseporlo general (casi) de inmediato, 
y 2) el experimentador puede obtener pronto informacidn crucial de un pequeno grupo de corridas que 
puede usarse para planear el siguiente experimento. Box [12f] denomina inmediatez y secuencialidad a es- 
tas dos caracteristicas de los experimentos industriales. En los 30 anos siguientes, la MSRy otras tecnicas 
de diseno se generalizaron en las industrias quimica y de proceso, sobre todo en el trabajo de investiga- 
tion y desarrollo. George Box fue el lider intelectual de este movimiento. Sin embargo, la aplicacidn del 
diseno estadistico a nivel de plantas o procesos de manufactura todavia no estaba muy generalizada. 
Algunas de las razones de ello incluyen la capacitacion inadecuada de ingenieros y otros especialistas en 
procesos en los conceptos y los metodos estadisticos basicos, asi como la falta de recursos de computation 
y software de estadistica que fueran faciles de usar para apoyar la aplicacidn de experimentos disenados 
estadisticamente. 

El interds creciente de la industria occidental en pi mejoramiento de cafidad que empezd a fines de la 
dccada de 1970 anuncid la tercera era del diseho estadistico. El trabajo de Genichi Ihguchi (Ihguchi y Wu 
[109], Kackar [62] y Ihguchi [108a, b]) tuvo un impacto significativo en el aumento del interes y el uso de 
los experimentos disenados. Ihguchi propugnaba por el uso de experimentos disenados para lo que deno- 
mind el diseho parametrico robusto, es decir, 

1. Hacer procesos insensibles a los factores ambientales o de otra indole que son dificiles de con- 
trolar. 

2. Fabricar productos insensibles a la variacidn transmitida por los componentes. 

3. Encontrar los niveles de las variables del proceso que obliguen a la media a un valor deseado 
mientras que al mismo tiempo se reduzca la variabilidad en tomo a este valor. 

Thguchi propuso disenos factorials altamente fraccionados y otros arreglos ortogonales junto con algu- 
nos metodos estadisticos nuevos para resolver estos problemas. La metodologia resultante generd mu- 
chas discusiones y controversias. Parte de la controversia surgio porque en Occidente la metodologia de 
Ihguchi fue defendida al principio (y sobre todo) por empresarios, y no se habia hecho la revisidn escruta- 
dora adecuada de la ciencia estadistica fundamental. Para fines de la dccada de 1980, los resultados de 
esta revisidn indicaron que aun cuando los conceptos y los objetivos enfocados en la ingenierfa de Thguchi 
tenian bases sdlidas, existian problemas sustanciales con su estrategia experimental y sus metodos para el 
analisis de los datos. Para detalles especificos de estas cuestiones, ver Box [12d], Box, Bisgaard y Fung 
[14], Hunter [59a, b], Myers y Montgomery [85a] y Pignatiello y Ramberg [94]. Gran parte de estas preo- 
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cupaciones se resumen tambidn en el amplio panel de discusion del numero de mayo de 1992 de Techno- 
metrics (ver Nair, et al [86]). 

Hubo al menos tres resultados positivos de la controversia desatada por Thguchi. Primero, el uso de 
los experimentos disenados se faizo mas generalizado en las industrias con piezas discretas, incluyendo la 
industria de manufacturas automotrices y aeroespaciales, de electrdnica y semiconductors, y muchas 
otras, que anteriormente hacian poco uso de esta tecnica. Segundo, se inicio la cuarta era del diseno esta- 
distico. Esta era ha incluido un renovado interes general tanto por parte de investigadores como de profe- 
sionales en ejereicio en el diseno estadistico y el desarrollo de varios enfoques nuevos y utiles para los 
problemas experimentales en el mundo industrial, incluyendo altemativas a los metodos t6cnicos de Th- 
guchi que permiten que sus conceptos de ingenieria se lleven a la pr&ctica de manera eficaz y eficiente, 
Algunas de estas altemativas se revisaran e ilustrar£n en capitulos subsecuentes, en particular en el capi- 
tulo 11. Tercero, la educacidn formal en diseno experimental estadistico se esta haciendo parte de los pro- 
gramas de ingenieria en las universidades, tanto a nivel de licenciatura como de posgrado. La integracidn 
exitosa de una buena pr £ctica del diseno experimental en la ingenieria y las cicncias es un factor clave en 
la competitividad industrial futura. 


1-6 RESUMEN: USO DE TECNICAS ESTADISTICAS EN LA 
EXPERIMENTACION 


Gran parte de la investigation en la ingenieria, las ciencias y la industria es empfrica y hace un uso extensi- 
vo de la experimentacion. Los metodos estadisticos pueden incrementar en gran medida la eficiencia de 
estos experimentos y con frecuencia pueden fortalecer las conclusiones asi obtenidas. El uso correcto de 
las tecnicas estadisticas en la experimentacion requiere que el experimentador tenga presentes los puntos 
siguientes: 

7. Uso de conocimientos no estadisticos del problema . Los experimentadores suelen poseer amplios co- 
nocimientos de sus respectivos campos, Por ejemplo, un ingeniero civil que trabaja en un problema de hi- 
drologia cuenta de manera tipica con considerable experiencia practica y capacitacidn academica formal 
en esta drea. En algunos campos existe un cuerpo enorme de teoria fisica en el cual indagar para explicar 
las relaciones entre los factores y las respuestas. Este tipo de conocimientos no estadisticos es invaluable 
para elegir los factores, determinar los niveles de los factores, decidir cuantas replicas correr, interpretar 
los resultados del analisis, etc, El uso de la estadistica no es sustituto de la reflexion sobre el problema. 

2. Mantener el diseno y el analisis tan simple como sea posible. Es necesario no exagerar en el uso de 
tecnicas estadisticas complejas y sofisticadas. Los metodos de diseno y analisis relativamente simples son 
siempre los mejores, En este punto cabe hacer hincapie nuevamente en el paso 4 del procedimiento reco- 
mendado en la seccidn 1-4, Si un diseno se hace de manera cuidadosa y correcta, el an&lisis casi siempre 
ser£ relativamente directo. Sin embargo, si el diseno se estropea grandemente por ineptitud, no es posible 
que incluso la estadistica mas compleja y elegante salve la situacidn. 

J. Tener presente la diferencia entre significacidn prdctica y significacion estadistica . Debido justamen- 
te a que dos condiciones experimentales producen respuestas medias que son estadisticamente diferen- 
tes, no existe ninguna seguridad de que esta diferencia sea de la magnitud suficiente como para tener 
algun valor pr£ctico. Por ejemplo, un ingeniero puede determinar que una modificacion en el sistema de 
inyeccion de combustible de un automovil puede producir un mejoramiento promedio real en el rendi- 
miento del combustible de 0,1 mi/gal. Este es un resultado estadisticamente significativo. Sin embargo, si 
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el costo de la modificacidn es de $1000, la diferencia de 0,1 mi/gal probablemente sera muy pequena para 
poseer algun valor practico. 

4. Los experimentos son generalmente iterativos. Recuerde que en la mayoria de las situaciones no es 
conveniente disenar un experimento demasiado comprensivo al principio de un estudio. Un diseno exito- 
so requiere conocer los factores importantes, los rangos en los que estos factores se haran variar, el nume- 
ro apropiado de niveles para cada factor y los m6todos y las unidades de medicidn adecuados para cada 
factor y respuesta, En general, ningun experimentador esta en position de responder estas cuestiones al 
principio del experimento, sino que las respuestas aparecen sobre la marcha. Esto habla en favor del en- 
foque iterativo o secuencial analizado anteriormente, Desde luego, hay situaciones en las que un experi- 
mento comprensivo es totalmente apropiado pero, como regia general, la mayoria de los experimentos 
deberan ser iterativos. Por consiguiente, no debera invertirse mas de 25% de los recursos para la experi- 
mentacion (corridas, presupuesto, tiempo, etc.) en el experimento inicial. Con frecuencia estos esfuerzos 
iniciales constituyen s61o experiencias de aprendizaje, y es necesario contar con recursos suficientes para 
alcanzar los objetivos finales del experimento. 




Experimentos 

comparativos simples 


En este capitulo se examinan los experimentos para comparar dos condiciones (llamadas en ocasiones 
tratamientos), a las cuales es comun denominar experimentos comparativos simples. Se empieza con el 
ejemplo de un experimento que se realiza para determinar si dos formulaciones diferentes de un produc- 
to producen resultados equivalentes. El estudio Ueva a revisar varios conceptos bAsicos de la estadistica, 
como variables aleatorias, distribuciones de probabilidad, muestras aleatorias, distribuciones de mues- 
treo y pruebas de hipdtesis. 


2*1 INTRODUCTION 

La fuerza de la tension de adhesidn del mortero de eemento portland es una caracteristica importante del 
producto. Un ingeniero estA interesado en comparar la fuerza de una formulacidn modificada en la que se han 
agregado emulsiones de l&tex de polimeros durante el mezclado, con la fuerza del mortero sin modificar. El 
experimentador ha reunido 10 observadones de la fuerza de la formulacibn modificada y otras 10 observation 
nes de la formulacidn sin modificar. Los datos se muestran en la tabla 2-1. Podrfa hacerse referenda a las dos 
formulaciones diferentes como dos tratamientos o como dos niveles del factor formulaciones. 

En la figura 2-1 se grafican los datos de este experimento. A esta representation se le llama diagrams 
de puntos. Del examen visual de estos datos se obtiene la impresidn inmediata de que la fuerza del morte- 
ro sin modificar es mayor que la fuerza del mortero modificado. Esta impresion se confirms al comparar 
las fuerzas de la tensidn de adhesidn promedio ,y x = 16,76 kgfi'cm 2 para el mortero modificado y y 2 = 17.92 
kgf/cm 2 para el mortero sin modificar. Las fuerzas de la tensidn de adhesidn promedio de estas dos mues- 
tras difieren en lo que parece ser una cantidad no trivial. Sin embargo, no es evidente que esta diferencia 
sea de la magnitud suficiente para implicar que las dos formulaciones son en realidad diferentes. Quiz&s 
esta diferencia observada en las fuerzas promedio sea el resultado de fluctuaciones del muestreo y las dos 
formulaciones sean id6nticas en realidad. Posiblemente otras dos muestras produzcan el resultado con- 
trario, con la fuerza del mortero modificado excediendo la de la formulacidn sin modificar. 

Puede usarse una t6cnica de la inferencia estadistica llamada prueba de hipdtesis (algunos autores 
prefieren el termino prueba de significacidn) para auxiliar al experimentador en la comparacion de estas 
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CAPfTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES 


Tabla 2-1 Datos de la fuerza de la tension de 
adhesidn del experimento de la 


formulacidn del cemento Portland 


j 

Mortero 

modificado 

yy 

Mortero sin 
modificar 

yy 

1 

16.85 

17.50 

2 

16.40 

17.63 

3 

17.21 

18.25 

4 

16,35 

18.00 

5 

16,52 

17.86 

6 

17.04 

17,75 

7 

16.96 

18.22 

8 

17.15 

17.90 

9 

16.59 

17.96 

10 

16,57 

18.15 


dos formulaciones. La prueba de hipdtesis permite que la comparacidn de las dos formulaciones se haga 
en terminos objetivos, con el conocimiento de los riesgos asociados si se llega a una conclusion equivoca- 
da. Antes de presentar los procedimientos de la prueba de hipotesis en experimentos comparativos sim- 
ples, se harA una breve revision de algunos conceptos elementales de la estadistica. 

2-2 CONCEPTOS ESTADISTICOS BASICOS 

A cada una de las observaciones del experimento del cemento portland citado anteriormente se le llama- 
ria una corrida. Observe que las corridas individuates difieren, por lo que existen fluctuaciones, o ruido, 
en los resultados. Es comun llamar a este ruido el error experimental o simplemente el error. Se trata de 
un error estadistico, lo cual significa que se origina por la variation que no esta bajo control y que gene- 
ralmente es inevitable. La presencia del error o ruido implica que la variable de respuesta, la fuerza de la 
tensidn de adhesion, es una variable aleatoria. Una variable aleatoria puede ser discreta o continua. Si el 
conjunto de todos los valores posibles de la variable aleatoria es finito o contablemente infinito, entonces 
la variable aleatoria es discreta, mientras que si el conjunto de todos los valores posibles de la variable 
aleatoria es un intervalo, entonces la variable aleatoria es continua. 

Descripcidn gr^fica de la variabilidad 

Es frecuente usar mdtodos graficos simples como ayuda para analizar los datos de un experimento. El 
diagrama de puntos, ilustrado en la figura 2-1, es un recurso muy util para representar un cuerpo reduci- 
do de datos (digamos hasta unas 20 observaciones). El diagrama de puntos le permite al experimentador 
ver de inmediato la localizacidn o tendencia central de las observaciones y su dispersion. Por ejemplo, en 
el experimento de la fuerza de tensidn de adhesidn del cemento portland, el diagrama de puntos revela 


L 

15 


_L 

16 


• M> M !••• 

k 17 


Q OP QQOft OCO 
*18 


Fuerza 

(kgf/cm 2 ) 


-L 

19 


J 

20 

• - Mortero modificado 


^ 16,76 y 2 * 17.92 


o ^ Mortero sin modificar 


Figura 2-1 Diagrama de puntos de los datos de la fuerza de la tensidn de adhesidn de la tabla 2-1. 



2-2 CONCEPTOS ESTADlSTICOS BASICOS 


23 



Figure 2-2 Histograma de 200 observaciones de la recuperacidn de metal (rendimiento) en 
un proceso de fundidon. 


que probablemente las dos formulaciones difieran en la fuerza promedio, pero que ambas producen 
aproximadamente la misma variation en la fuerza. 

Cuando los datos son muy numerosos, es diflcil distinguir las observaciones graficadas en un diagra- 
ma de puntos, y en tal caso seria preferible un histograma. En la figura 2-2 se presenta el histograma de 
200 observaciones de la recuperacibn de metal (o rendimiento) en un proceso de fundicibn. El histogra- 
ma muestra la tendencia central, la dispersion y la forma general de la distribution de los datos. Recuerde 
que un histograma se construye dividiendo el eje horizontal en intervalos (generalmente de longitud 
igual) y trazando un rectangulo sobre el intervalo y-esimo con el Orea del rectangulo proporcional a n p el 
numero de observaciones incluidas en ese intervalo. 

El diagrama de caja (o diagrama de caja y bigotes) es una manera muy util de representar grOfica- 
mente los datos. En un diagrama de caja se muestra el minimo, el maximo, los cuartiles inferior y superior 
(el percentil 25 y el percentil 75, respectivamente) y la mediana (el percentil 50) en una caja rectangular 
alineada horizontal o verticalmente. La caja se extiende del cuartil inferior al cuartil superior y se traza 
una linea por la mediana que atraviesala caja. Se trazan dos llneas (o bigotes) que se extienden de los ex- 
tremos de la caja hasta (de manera tipica) los valores minimo y maximo. (Existen diversas variantes de los 
diagramas de caja que tienen reglas diferentes para denotar los puntos muestrales extremos. Ver Montgo- 
mery y Runger [83d] para mOs detalles.) 

En la figura 2-3 se muestran los diagramas de caja de las dos muestras de la fuerza de la tension de 
adhesiOn en el experimento del mortero de cemento portland. En esta representation se revela con toda 
claridad la diferencia en la fuerza promedio entre las dos formulaciones. Indica asimismo que ambas for- 
mulaciones producen distribuciones de la fuerza razonablemente simOtricas con una variabilidad o dis- 
persion similar. 

Los diagramas de puntos, los histogramas y los diagramas de caja son utiles para resumir la informa- 
tion de una muestra de datos. Para describir con mayor detalle las observaciones que podrian presentarse 
en una muestra, se usa el concepto de distribution de probabilidad. 

Distribuciones de probabilidad 

La estructura de la probabilidad de una variable aleatoria, por ej employ, se describe mediante su distri- 
bution de probabilidad. Cuando y es discreta, es comun hacer referenda a su distribution de probabili- 
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ST 

g 18.4 


1 17.6 

TD 
tc 

% 17.2 

c 
:2 

| 16.8 

S 

■S 16.4 

<o 

jl 16 

^ Modificado Sin modificar 

Formulacibn del mortero 

Figura 2-3 Diagramas de caja del experimento de la fuerza de la ten- 
si6n de adhesidn del cemento portland. 

dad, por ejemplo p(y), como la funcidn de probabilidad de y. Cuando y es continua, es comun hacer 
referenda a su distribucidn de probabilidad, por ejemplo /(y), como la funcidn de densidad de probabili- 
dad de y. 

F.n la figura 2-4 se ilustran dos distribuciones de probabilidad hipotdticas, una discreta y la otra conti- 
nua. Observe que en la distribution de probabilidad discreta es la altura de la funcidn p(yj) la que repre- 
senta la probabilidad, mientras que en el caso continuo, es el Area. bajo la curva f(y) asociada con un 


Dia gramas de caja y bigotes 




a) Una distribuddn discreta 



Figura 2-4 Distribuciones de probabilidad discreta y continua. 
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intervalo dado la que representa la probabilidad. Un resumen cuantitativo de las propiedades de las dis- 
tribuciones de probabilidad seria el siguiente: 


V discreta: 


y continua: 


0 < p(yj ) < 1 todos los valores de y, 

P{y~y )= p(y ) todos los valores de y f 

2 Kr,)-‘ ’ 

todos los 
valores de 


o</(y) 

P(a<y<b)= $ b J{y)dy 


£j(y) d y =1 


Media, varianza y valores esperados 

La media, /*, de una distribuci6n de probabilidad es una medida de su tendencia central o localizaci6n, 
Matemdticamente, la media se define como 




r_ v yf(y)dy 

'Zyp(y) 

toda y 


y continua 
y discreta 


(2-1) 


La media tambicn puede expresarse en terminus del valor esperado o valor promedio a la larga de la va- 
riable aleatoria y como 


p = £(y)= 


f.„xf(y)<ty 

^yp(y) 

toda y 


y continua 
y discreta 


(2-2) 


donde E denota el operador del valor esperado. 

La variabilidad o dispersidn de una distribution de probabilidad puede medirse con la varianza, la 
cual se define como 


a 


i 


^(y-p) 2 p(y) 

today 


y continua 
y discreta 


(2-3) 


Observe que la varianza puede expresarse exclusivamente en terminos del valor esperado debido a que 

a 2 =£[(y-/0 2 ] (2-4) 

Por ultimo, el uso de la varianza es tan frecuente que resulta conveniente definir un operador de la va- 
rianza V tal que 


V(y)=E[(y-fiY]^a 2 


(2-5) 



26 CAPITULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES 


Los conceptos de valor esperado y varianza se usan constantemente a lo largo de este libro, y puede 
ser util revisar varios resultados elementales relacionados con estos operadores. Siy es una variable alea- 
toria con media fi y varianza o 2 y c es una constante, entonces 

1. E(c) = c 

2. E(y) = fi 

3. E(cy) = cE(y ) = cfi 

4. V(c)= 0 

5. V(y)=a 2 

6. V(cy) = c 2 V(y) = c 2 o 2 

Si hay dos variables aleatorias, por ejemplo,y 1 con E(y\) - n x y V(y x ) = a\ y y 2 con E(y 2 ) = fi 2 y V(y 2 ) = 
a 2 , se tiene 

7. E( yi +y 2 )= E(y l )+E(y 2 )= 

Es posible demostrar que 

»■ y(yx+y2)=V( yi )+V(y 2 )+2 Cov(y v y 2 ) 

donde 


CovU. y 2 ) = £[(>1 - El )(y 2 -El )] (2-6) 

es la covarianza de las variables aleatorias y x y y 2 . La covarianza es una medida de la asociacidn lineal en- 
tre y 1 y y 2 , Mas especificamente, puede demostrarse que si y 1 y y 2 son independientes, 1 entonces 
Covfyj, y 2 ) = 0, T&mbi6n puede demostrarse que 

9- nvi -y 2 )= V{y x )+V(y 2 )- 2 Cov (*, y 2 ) 

Si yi y y 2 son independientes, se tiene 

10. V(y 1 ±y 2 ) = V(y 1 )+V(y 2 ) = o 2 1 +o 2 2 


11. E(y 1 -y 2 )=E(y x )-E(y 2 )=fi 1 -E2 

Sin embargo, observe que, en general, 


12 . 


m 


'a 

\y 2 


E(y i) 


E(y 2 ) 

sin importar si y 1 y y 2 son independientes o no. 


2*3 MUESTREO Y DISTRIBUCIONES DE MUESTREO 

Muestras aleatorias, media muestral y varianza muestral 

El objetivo de la inferencia estadistica es sacar conclusiones acerca de una poblacidn utilizando una 
muestra de la misma. La mayoria de los m6todos que se estudiar^n aqui incluyen el supuesto de que se 


1 Observe que el recfproco no es necesariamente verdadero; es decir, puede tenerse Cov (y lt y 2 ) = 0 y no obstante esto no implica que 

las variables sean independientes. Para un ejemplo, ver Hines y Montgomery ([55] pp. 128-129). 
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usan muestras aleatorias. Es decir, si la poblacidn contiene N elementos y va a seleccionarse una muestra 
de n de ellos, y si cada una de las N\/(N -n)\n\ muestras posibles tiene una probabilidad igual de ser esco- 
gida, entonces al procedimiento empleado se le llama muestreo aleatoric. En la pr&ctica, en ocasiones es 
diflcil obtener muestras aleatorias, para lo cual pueden ser litiles las tablas de mimeros aleatorios, como 
la tabla XI del ap^ndice. 

En la inferencia estadistica se utilizan profusamente cantidades calculadas a partir de las observacio- 
nes de la muestra. Un estadistico se define como cualquier funcidn de las observaciones de una muestra 
que no contiene par&metros desconocidos. Por ejemplo, suponga qu ey x ,y 2 , ...,y w representa una muestra. 
Entonces la media muestral 



y la varianza muestral 

1 ( >,-»■ 

5 2 = -*=i (2-8) 

son estadisticos. Estas cantidades son medidas de la tendencia central y la dispersidn de la muestra, res- 
pectivamente. En ocasiones se usa S = Vis 2 ", llamada la desviaci6n estdndar muestral, como medida de 
dispersidn. Los ingenieros suelen preferir el uso de la desviacion est&ndar para medir la dispersidn debi- 
do a que se expresa en las mismas unidades que la variable de interns y \ 


Propiedades de la media y la varianza muestrales 

La media muestraly es un estimador puntual de la media poblacional pi, y la varianza muestral S 2 es un es- 
timador puntual de la varianza poblacional cr 2 . En general, un estimador de un par&metro desconocido es 
un estadfstico que corresponde con dicho par&metro* Observe que un estimador puntual es una variable 
aleatoria. Al valor num6rico particular de un estimador, calculado a partir de los datos muestrales, se le 
llama una estimacidn. Por ejemplo, suponga que quiere estimarse la media y la varianza de la resistencia a 
la ruptura de un tipo particular de fibra textil. Se prueba una muestra aleatoria de n - 25 ejemplares de 
prueba de la fibra y se registra la resistencia de cada uno de ellos. La media y la varianza muestrales se cal- 
culan de acuerdo con las ecuaciones 2-7 y 2-8, respectivamente, obtenigndosey = 18.6 y S 2 = 1.20. Por lo 
tanto, la estimacidn de es y = 18.6 y la estimacidn de a 2 es S 2 = 1.20. 

Un buen estimador puntual debe tener varias propiedades. Dos de las m&s importantes son las si- 
guientes: 

1* El estimador puntual deber& ser insesgado. Es decir, el par&metro que se estd estimando deberS 
ser el promedio o valor esperado a la larga del estimador puntual. Aun cuando la ausencia de ses- 
go es deseable, esta propiedad por si sola no siempre hace que un estimador sea adecuado. 

2, Un estimador insesgado debera tener la varianza minima. Esta propiedad establece que el esti- 
mador puntual de varianza minima tiene una varianza que es menor que la varianza de cualquier 
otro estimador del par&metro en cuestidn. 
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Es sencillo demostrar quey y S 2 son estimadores insesgados de fi y o 2 , respectivamente. Considere 
primero y. A1 utilizar las propiedades del valor esperado, se tiene 

2j y> 

E{y)=E\ 


-At* 


^ 1=1 
1 n 


= A 


porque el valor esperado de cada observacidny, es/t. Por lo tanto,y es un estimador insesgado dcp. 
Considere ahora la varianza muestral S 2 . Se tiene 


E(S 2 )=E 


i=l 


»-l 


1 

n-1 

1 

n — 1 


£(*-»■] 


£ 
E(SS) 


donde SS = Z" =1 (y. - y) 2 es la soma de cuadrados corregida de las observaciones y,. Entonces 


E(SS) 


■y) 


■riy 2 


-j!??-. 

= 2 (fi 2 +o 2 )-n(fi 2 +a 2 /n) 
= (n-l)a 2 


( 2 - 9 ) 


( 2 - 10 ) 


Por lo tanto, 


£(S 2 )=-L-£(SS) 


^-1 


= £7 


y se observa que S 2 es un estimador insesgado de a 2 . 
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Grados de libertad 

A la cantidad n - 1 de la ecuaciOn 2-10 se le llama el ntimero de grados de libertad de la suma de cuadra- 
dos SS. Se trata de un resultado muy general; es decir, si y es una variable aleatoria con varianza cr 2 y 
SS = H(y l - y) 2 tiene v grados de libertad, entonces 

( 2 - 11 ) 

El numero de grados de libertad de una suma de cuadrados es igual al numero de elementos independien- 
tes en dicha suma de cuadrados. Por ejemplo, SS = - y) 2 enla ecuacion 2-9 consiste en la suma de 

los cuadrados de los n elementos y l ~y, y 2 — y, ■ • y„ ~ y- No todos estos elementos son independientes 
porque 2" =1 (y ( . - y) = 0, de hecho, s61o n - 1 de ellos son independientes, lo cual implica que SS tiene n- 1 
grados de libertad. 


La distribucion normal y otras distribuciones de muestreo 

En muchas ocasiones la distribucidn de probabilidad de un estadistico particular puede determinarse si se 
conoce la distribucion de probabilidad de la poblacidn de la que se tomd la muestra. A la distribution de 
probabilidad de un estadistico se le llama la distribucidn de muestreo. A continuation se revisan breve- 
mente varias distribuciones de muestreo utiles. 

Una de las distribuciones de muestreo m&s importantes es la distribution normal. Siy es una variable 
aleatoria normal, la distribution de probabilidad de y es 


f (y)= 


1 --(l/2)[(y-^)/a] z 

oV2jt 


— oo< y < oo 


( 2 - 12 ) 


donde -oo < ^ < » es la media de la distribucibn y cr 2 > 0 es la varianza. En la figura 2-5 se ilustra la distri- 
bucibn normal. 

Debido a que las corridas muestrales que difieren como resultado del error experimental a menudo 
se encuentran descritas adecuadamente en la distribucibn normal, bsta desempena un papel fundamental 
en el andlisis de los datos de experimentos disenados. Tkmbibn es posible definir muchas distribuciones 
de muestreo importantes en tbrminos de variables aleatorias normales. Con frecuencia se usa la notacibn 
y ~ N{fi , o 2 ) para denotar que y sigue una distribucibn normal con media pi y varianza o 2 . 

Un caso especial importante de la distribucibn normal es la distribucibn normal estbndar; es decir, 
^ o y a 2 = 1, Se observa que si y ~ N(pt, o 2 ), la variable aleatoria 


z- 


yzJL 

a 


(2-13) 



Figura 2-5 La distribuctin normal. 



30 CAPfTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES 


sigue la distribuci6n normal estdndar, denotadaz ~ ;V(0, 1). A la operaci6n ilustrada en la ecuacidn 2-13 
suele llam&rsele la estandarizacidn de la variable aleatoria normaly. En la tabla I del apendice se presen- 
ta la distribucidn normal estdndar acumulada. 

En muchas t6cnicas estadisticas se supone que la variable aleatoria sigue una distribucion normal. El 
teorema del limite central es con frecuencia una justificacion de la normalidad aproximada. 

TEOREMA 2-1 

El teorema del limite central 

Si^i,^, ...,y„ es una sucesion de n variables aleatorias independientes que tienen una distribucidn identica 
con E(y,) = ju y V(y,) = a 2 (ambas finitas) y x = y, + y 2 + ... + y n , entonces 

x—nfi 


tiene una distribucion N(0, 1) aproximada en el sentido de que, si F n (z) es la funcion de la distribu- 
ci6n de z„ y 3>(z) es la funcidn de la distribucidn de la variable aleatoria N(0, 1), entonces lim n ^ „[F„(z)/ 
0(z)] = 1. 


Este resultado establece en esencia que la suma de n variables aleatorias independientes que tienen una 
distribucidn identica sigue una distribucion aproximadamente normal. En muchos casos esta aproxima- 
cion es adecuada para valores muy pequenos de n, digamos n < 10, mientras que en otros casos se necesi- 
ta un valor grande de n, digamos n > 100. Frecuentemente se considera que el error de un experimento 
surge de una manera aditiva de varias fuentes independientes; por consiguiente, la distribucion normal se 
convierte en un modelo recomendable para el error experimental combinado. 

Una importante distribucidn de muestreo que puede definirse en terminos de variables aleatorias 
normales es la distribucion x 2 o ji-cuadrada. Si z„ z 2 , . . ., z k son variables aleatorias que tienen una distri- 
bucidn normal e independiente con media 0 y varianza 1, cuya abreviatura es NID(0, 1), entonces la varia- 
ble aleatoria 


x=z 2 +z 2 H — Yz\ 

sigue la distribucidn ji-cuadrada con k grados de libertad. La funcidn de densidad de la distribucidn 
ji-cuadrada es 

f(x)= 7 j-rx (k,2) - 1 e- xl2 x>0 (2-14) 


En la figura 2-6 se ilustran varias distribuciones ji-cuadrada. La distribucidn es asimdtrica, o sesgada, 
con media y varianza 


fi = k 

a 2 =2k 


respectivamente. En la tabla III del apendice se presentan los puntos porcentuales de la distribucidn 
ji-cuadrada. 
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Figura 2-6 Varias distribuciones ji-cuadrada* 


Como un ejemplo de una variable aleatoria que sigue la distriburi6n ji-cuadrada, suponga que y l# 
yi, es una muestra aleatoria de una distribution Nyt, a 2 ). Entonces 



(y-y ) 2 


-xl-1 


(2-15) 


Es detir, SS/a 2 sigue una distribution ji-cuadrada con n - 1 grados de libertad. 

Muchas de las tecnicas utilizadas en este libro requieren el c&lculo y la manipulation de sumas de 
cuadrados. El resultado dado en la ecuatiOn 2-15 es de suma importancia y aparece en multiples ocasio- 
nes; cuando una suma de cuadrados de variables aleatorias normales se divide por o 2 sigue la distribution 
ji-cuadrada. 

A1 examinar la ecuaciOn 2-8, se observa que la varianza muestral puede escribirse como 


S 2 = 


SS 


n - 1 


(2-16) 


Si las observations de la muestra son NID(u, o 2 ), entonces la distribution de S 2 es [^/(n - l)]j^^_ 1 . Por lo 
tanto, la distribuciOn de muestreo de la varianza muestral es una constante multiplicada por la distribu- 
tion ji-cuadrada si la poblaciOn tiene una distribution normal. 

Si z y / 2 son variables aleatorias independientes normal est&ndar y ji-cuadrada, respectivamente, la 
variable aleatoria 


yfxUk 


(2-17) 


sigue la distribution t con k grados de libertad, denotada t k . La funciOn de densidad de t es 

r[(fc+l )/2] 1 

-Jhir(k/2)[(t 2 /k)+l] ik+1)n CD<t<C0 (2-18) 

y la media y la varianza de t son n = 0 y o 2 = k/(k - 2) para k> 2, respectivamente. En la figura 2-7 se ilus- 
tran varias distribuciones t. Observe que sik = <*>, la distribuciOn t se convierte en la distribution normal 
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Figure 2-7 Varias distribuciones t. 


estandar. En la tabla II del apOndice se presentan los puntos porcentuales de la distribution t. Siy^yj, ■■■, 
y„ es una muestra aleatoria de una distribution NQi, a 2 ), entonces la cantidad 


t 


y~n 

Sl4n 


( 2 - 19 ) 


se distribuye como t con n - 1 grados de libertad. 

La ultima distribution de muestreo que consideraremos es la distribution F Si/^ y%l son dos varia- 
bles aleatorias ji-cuadrada independientes con uyv grados de libertad, respectivamente, entonces el co- 
ciente 

F = ( 2 - 20 ) 

sigue la distribution F con u grados de libertad en el numerador y v grados de libertad en el denominador. 
Si x es una variable aleatoria F con u grados de libertad en el numerador yv grados de libertad en el deno- 
minador, entonces la distribution de probabilidad de x es 



Ocjccoo 


( 2 - 21 ) 



X 


Figura 2-8 Varias distribuciones F. 
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En la figura 2-8 se ilustran varias distribuciones F. Esta distribucidn es muy importante en el an41isis esta- 
dlstico de experimentos disenados. En la tabla IV del apdndice se presentan los puntos porcentuales de la 
distribuci6n F. 

Como un ejemplo de un estadfstico que sigue una distribucidn F, suponga que se tienen dos poblacio- 
nes normales independientes con varianza comun a 2 . Siy n ,y 12 , ..., y Ui es una muestra aleatoria de n 2 ob- 
servaciones de la primera poblaci6n y siy 21 ,y 22 , y 2 „ 2 es una muestra aleatoria de n 2 observaciones de la 
segunda, entonces 



-1. n 2 -l 


( 2 - 22 ) 


donde S, 2 y Si son las dos varianzas muestrales. Este resultado se sigue directamente de las ecuaciones 
2-15 y 2-20. 


2-4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS, 

DISENOS ALEATORIZADOS 

Estamos preparados ahora para volver al problema del mortero de cemento portland de la seccion 2-1. 
Recuerde que se estaban investigando dos formulaciones diferentes para determinar si dificren en la 
fuerza de la tensidn de adhesidn. En esta seccion se examina como pueden analizarse los datos de este ex- 
perimento comparativo simple utilizando procedimientos de prueba de hipotesis e intervalos de confian- 
za para comparar las medias de dos tratamientos. 

A lo largo de esta seccidn se supone que se usa un dlseno experimental completamente aleatorizado. 
En este diseno, los datos se consideran como si fueran una muestra aleatoria de una distribution normal. 

2-4.1 Prueba de hipdtesis 

Se retoma ahora el experimento del cemento portland introducido en la seccion 2-1. Recuerde que el in- 
terls se encuentra en comparar la fuerza de dos formulaciones diferentes: una del mortero sin modificar y 
una del mortero modificado. En general, estas dos formulaciones pueden considerate como dos niveles 
del factor “formulaciones”. Sea quey u ,y 12 , ..., y 1(li represente las n, observaciones del primer nivel del 
factor y quey 21 ,y 22> . y 2))j represente las n 2 observaciones del segundo nivel del factor. Se supone que 
las muestras se sacan al azar de dos poblaciones normales independientes. En la figura 2-9 se ilustra la 
situacion. 



Nivel 1 del factor Nivel 2 del factor 

Figura 2-9 La situacidn del muestreo para la prueba t de doB muestras. 
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Un modelo de los datos 

Con frecuencia los resultados de un experimento se describen con un modelo. Un modelo estadistico sim- 
ple que describe los datos de un experimento como el que acaba de describirse es 


JV 




7 = 1 , 2 

7=1, 2, n t 


(2-23) 


dondey^ es la observacidn ;-6sima del nivel i del factor, ^ es la media de la respuesta para el nivel simo 
del factor, y E tj es una variable aleatoria normal asociada con la observacidn y-6 sima. Se supone que las e i} 
son NID(0, a\ ), i ~ 1, 2. Se acostumbra hacer referenda a como el componente del error aleatorio del 
modelo. Puesto que las medias ^ y /* 2 son constantes, se observa directamente a partir del modelo que las 
son NID(// i5 o\ ), i = 1, 2, como se acaba de suponer arriba. Para mis informacidn acerca de los modelos 
de los datos, referirse al material suplementario del texto. 


Hipdtesis estadisticas 

Una hipdtesis estadistica es un enunciado o afirmacidn ya sea acerca de los parlmetros de una distribu- 
cidn de probabilidad o de los parlmetros de un modelo. La hipotesis refleja alguna conjetura acerca de la 
situacidn del problema. Por ejemplo, en el experimento del cemento portland, puede pensarse que las 
fuerzas de la tensidn de adhesidn promedio de las dos formulaciones del mortero son iguales. Esto puede 
enunciarse formalmente com o 


H 0 :fi 1 = /* 2 

donde /u r es la fuerza de la tensi6n de adhesidn promedio del mortero modificado ypi 2 es la fuerza de ten- 
sion de enlace promedio del mortero sin modificar. Al enunciado = /^2 se llama la liipdtesis nula y 
a Hijti * // 2 se le llama la hipotesis alternativa. A la hipdtesis altemativa que se especifica aqui se le llama 
hipdtesis alternativa de dos colas porque serfa verdadera si < fi 2 0 si jU l > ju 2 - 

Para probar una hipdtesis se proyecta un procedimiento para tomar una muestra aleatoria, calcular 
xm estadistico de prueba apropiado para despues rechazar o no estar en posicidn de rechazar la hipdtesis 
nula H 0 . Parte de este procedimiento consiste en especificar el conjunto de valores del estadistico de 
prueba que llevan al rechazo de H 0 . A este conjunto de valores se le llama la regidn critica o regidn de re- 
chazo de la prueba. 

Pueden cometerse dos tipos de errores cuando se prueban hipdtesis. Si la hipdtesis nula se rechaza 
cuando es verdadera, ha ocurrido un error tipo I. Si la hipdtesis nula no se rechaza cuando es falsa, se ha 
cometido un error tipo II. Las probabilidades de estos dos errores se expresan con simbolos especiales: 

a = P( error tipo I) = P(rechazar H 0 1 H 0 es verdadera) 
fi = P( error tipo II) = P( dejar de rechazar H 0 \ H 0 es falsa) 

En ocasiones es mis conveniente trabajar con la potencia de la prueba, donde 

Potencia - 1 - fi = P( rechazar H 0 \ H 0 es falsa) 

El procedimiento general en la prueba de hipdtesis es especificar un valor de la probabilidad a del error 
tipo I, llamada con frecuencia el nivel de significacion de la prueba, y despu6s disenar el procedimiento 
de prueba de tal modo que la probabilidad del error tipo II tenga un valor convenientemente pequeno. 
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La prueba t de dos muestras 

Considere que puede suponerse que las varianzas de las fuerzas de la tensidn de adhesion fueron identi- 
cas para ambas formulaciones del mortero. Entonces el estadistico de prueba que deberd usarse para 
comparar las medias de dos tratamientos en el diseno completaraente aleatorizado es 



(2-24) 


donde^! yy 2 son las medias muestrales, n x y n 2 son los tamanos de las muestras, S 2 p es una estimation de la 
varianza comun of =o\=o 2 calculada a partir de 


S 


i 

p 


{rh -l)Sl + {n 2 -l)Sl 


+n 2 -2 


(2-25) 


y Sf y Sf son las dos varianzas muestrales individuales. Para determinar si deberA rechazarse - fi 2 , 
se compararia t 0 con la distribucidn t con n x + n 2 - 2 grados de libertad. Si | t a \ > + 2 , donde 

t a/2 „ i + „ 2 _ 2 es el punto porcentual all superior de la distribution t con n l + n 2 -2 grados de libertad, en- 
tonces se rechazaria H Q y se concluiria que las fuerzas promedio de las dos formulaciones del mortero de 
cemento portland difieren. A este procedimiento de prueba se le llama generalmente la prueba t de dos 
muestras. 

Este procedimiento puede justificarse de la siguiente manera. Si el muestreo se esta haciendo de dis- 
tribuciones normales independientes, entonces la distributidn dev, -y 2 es A/[//, -fi 2 , o 2 (lln l + l/n 2 )]. Por 
lo tanto, si se conociera a 2 , y si = Hi fuera verdadera, la distribucidn de 




yi - y 2 



(2-26) 


seriaJV(0, 1). Sin embargo, al sustituir o con S p en la ecuacidn 2-26, la distribucidn de Z 0 cambia de la nor- 
mal est&ndar a la distribucidn t con n 2 + n 2 - 2 grados de libertad. Ahora bien, si H 0 es verdadera, t 0 de la 
ecuati6n 2-24 se distribuye como t Hi +Bj _ 2 y, por consiguiente, se esperaria que 100(1 -a) por ciento de los 
valores de t Q esten entre ~t al2<ni +nj _ 2 y f„ /2 „ i +nj _ 2 . Una muestra que produjera un valor de t 0 que estuviera 
fuera de estos limites seria inusual si la hipdtesis nula fuera verdadera y es evidencia de que H 0 deber6 re- 
chazarse. Por lo tanto, la distribuci6n t con n 2 + n 2 - 2 grados de libertad es la distribucidn de referenda 
apropiada para el estadistico de prueba t 0 . Es decir, describe el comportaraiento de t 0 cuando la hipotesis 
nula es verdadera. Observe que a es la probabilidad del error tipo I de la prueba. 

En algunos problemas quizd quiera rechazarse H 0 unicamente si una de las medias es mayor que la 
otra. Por lo tanto, se especificaria una hipdtesis alternativa de una cola Hy.fi 2 > fi 2 y H 0 solo se rechazaria 
si t n > t a „ i+nj ^ 2 . Si se desea rechazar H a s61o si /I, es menor que fi 2 , entonces la hipdtesis alternativa es 
HiV i < t* 2 , y H 0 se rechazaria si t 0 < -t ani +Bj _ 2 . 

Para ilustrar el procedimiento, considere los datos del cemento portland de la tabla 2-1. Para estos 
datos, se encuentra que 


Mortero modiflcado 

ft = 16.76 kgf/ cm 2 

s ; 2 = 0.100 
Sl =0.316 
— 10 


Mortero sin modificar 

y 2 = 17.92 kgf / cm 2 
S 2 2 = 0.061 
S 2 = 0,247 
n ? =10 
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Puesto que las desviaciones estandar muestrales son razonablemente similares, no es improcedente con- 
cluir que las desviaciones est&ndar (o las varianzas) poblacionales son iguales. Por lo tanto, puede usarse 
la ecuacidn 2-24 para probar las hipdtesis 

H 

Adem&s, + n 2 - 2 = 10 + 10 - 2 = 18, y si se elige a = 0.05, entonces = n 2 se rechazaria si el valor 
numerico del estadistico de prueba t 0 > f 0025 18 = 2.101, o si t 0 < -t n n? < 18 = -2.101. Estos limites de la re- 
gion critica se ilustran en la distribution de referencia (t con 18 grados de libertad) de la figura 2-10. 

A1 utilizar la ecuacion 2-25 se encuentra que 

j2 _ (n 1 -l)5i 2 +(n 2 -l)5 2 2 

9(0.100) +9(0.061) 

10+10-2 
= 0.081 
S p = 0.284 


y el estadistico de prueba es 



16.76-17.92 


0.284V£+^ 
= -9.13 


Puesto que t 0 = -9.13 < -^ 0 . 025 , is = -2-101, se rechazaria H 0 y se concluiria que las fuerzas de la tensidn de 
adhesion promedio de las dos formulaciones del mortero de cemento portland son diferentes. 



*0 


Figura 2-10 La distribuci6n t con 18 grados de libertad con la regidn critica 

— ^ 0 . 025 , 18 = ^ 2,101 ♦ 
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El u$o de valores P en la prueba de hipbtesis 

Una manera de reportar los resultados de una prueba de hipdtesis es estableciendo que la hipdtesis nula 
fue rechazada o no para un valor de a o nivel de significaci6n especffico. Por ejemplo, en el experimento 
del mortero de cemento portland anterior puede dedrse que = fi % se rechazd con el nivel de signifi- 
cacidn 0.05. Esta enunciation de las condusiones es con frecuencia inadecuada porque no le ofrece al res- 
ponsable de la toma de decisiones idea alguna de si el valor calculado del estadistico de prueba apenas 
rebasd la region de rechazo o si se adentro bastante en la misma. Adem&s, al darse los resultados de esta 
manera se les impone a otros usuarios de la information el nivel de signification predefinido. Este enfo- 
que puede ser insatisfactorio porque algunos responsables de la toma de decisiones podrian sentirse inco- 
modos con los riesgos que implica el valor a - 0.05. 

Para evitar estas dificultades, en la practica se ha adoptado extensivamente el enfoque del valor P. El 
valor P es la probabilidad de que el estadistico de prueba asuma un valor que sea al menos tan extremo 
como el valor observado del estadistico cuando la hipOtesis nula H 0 es verdadera. Por lo tanto, un valor P 
transmite mucha information acerca del peso de la evidencia en contra de H 0 y, por consiguiente, el res- 
ponsable de la toma de decisiones puede llegar a una conclusion con cualquier nivel de signification espe- 
cificado, En terminos m&s formales, el valor P se define como el nivel de significacion menor que llevaria 
a rechazar la hipotesis nula H 0 . 

Se acostumbra decir que el estadistico de prueba (y los datos) es significativo cuando se rechaza la hi- 
potesis nula; por lo tanto, el valor P puede considerarse como el menor nivel a en el que los datos son sig- 
nificativos. Una vez que se conoce el valor P, el responsable de la toma de decisiones puede determinar la 
medida en que los datos son significativos sin que el analista de los datos imponga formalmente un nivel 
de signification preseleccionado. 

No siempre es sencillo calcular el valor P exacto de una prueba. Sin embargo la mayoria de los progra- 
mas de computation modernos para realizar an&lisis estadisticos reportan valores P, y pueden obtenerse 
tambien en algunas calculadoras portatiles. A continuation se indicara c6mo obtener una aproximaciOn 
del valor P para el experimento del mortero de cemento portland. Por la tabla II del apOndice, para una 
distribution t con 18 grados de libertad, la probabilidad menor en el &rea de la cola es 0.0005, para la cual 
^ 0 . 0005 , is - 3.922. Ahora bien, 1 1 0 \ - 9.13 > 3.922, de donde, ya que la hipotesis altemativa es de dos colas, 
se sabe que el valor P debe ser menor que 2(0.0005) 0.001. Algunas calculadoras portatiles tienen la ca- 

pacidad para calcular valores P. Una de ellas es la HP-48. Utilizando esta calculadora se obtiene el valor P 
para el valor f 0 = -9.13 del experimento de la formulacion del mortero de cemento portland como 
P = 3.68 x 10~*. Por lo tanto, la hipdtesis nula/fo^ = fi 2 se rechazaria con cualquier nivel de significacion 
a > 3.68 x 10" 8 . 

Solucidn por computadora 

Hay muchos paquetes de software de estadistica que cuentan con la capacidad para probar hipotesis esta- 
disticas. En la tabla 2-2 se presenta la salida del procedimiento para la prueba t de dos muestras de Mini- 
tab aplicado al experimento de la formulacibn del mortero de cemento portland. Observe que la salida 
incluye algunos estadisticos concisos acerca de las dos muestras (la abreviatura “SE Mean” [“SE media”] 
se refiere al error estandar de la media, s / 4n), asi como alguna informacidn sobre los intervalos de con- 
fianza para la diferencia en las dos medias (los cuales se revisan en las secciones 2-4.3 y 2-6). El programa 
tambi6n prueba la hipdtesis de interes, permitiendo que el analista especifique la naturaleza de la hipdte- 
sis alternativa (“not =” [“no =”] significa ^ fi 2 ) Y cleccion de a (a = 0.05 en este caso). 

La salida incluye el valor calculado de f 0 , el valor P (llamado el nivel de significacidn) y la decisidn que 
deberia tomarse dado el valor especificado de a . Observe que el valor calculado del estadistico t difiere li- 
geramente del valor que se calculo manualmente aqui y que el valor P que se reporta es P = 0.0000. Mu- 
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Tabla 2-2 Prueba t de dos muestras usando Minitab para el experimento del mortero de cemento pordand 


Prueba t de dos muestras e intervalo de confianza 

Two sample T for Modified vs Unmod 



N Mean 

Modified 10 16.774 

Unmod 10 17.922 

StDev 

0.309 

0.248 

SE Mean 
0.098 
0.078 

95% Cl for mu Modified - mu Unmod: C 
t-Test mu Modified = mu Unmod <vs not 
P = 0.0000 DF = 18 

Both use Pooled StDev = 0.280 

-1.411, 

= ) : T = 

-0.885) 

-9.16 


chos paquetes de software no reportardn un valor P real menor que 0,0001 y en su lugar presentan un 
valor “por omisidn”. Este es el caso aquf. 


Verificacidn de los supuestos en la prueba t 

Para utilizar el procedimiento de la prueba t se establecen los supuestos de que ambas muestras se toman 
de poblaciones independientes que pueden describirse con una distribucidn normal, que las desviaciones 
est&ndar o las varianzas de ambas poblaciones son iguales, y que las observaciones son variables aleato- 
rias independientes. El supuesto de independencia es crftico, pero si el orden de las corridas esta aleatori- 
zado (y, de ser apropiado, se seleccionan al azar otras unidades y materiales experimentales), este 
supuesto por lo general se satisfar#. Los supuestos de la igualdad de las varianzas y la normalidad son fdci- 
les de verificar utilizando una grdfica de probabilidad normal. 

En general, la graficacidn de probabilidades es una tecnica para determinar si los datos muestrales se 
ajustan a una distribucidn hipotetizada con base en un examen visual subjetivo de los datos. El procedi- 
miento general es muy simple y puede realizarse rapidamente con la mayorfa de los paquetes de software 
de estadistica. En el material suplementario del texto se analiza la construccidn manual de las gr&ficas de 
probabilidad normal. 

Para construir una gr&fica de probabilidad, primero se ordenan de menor a mayor las observaciones 
de la muestra. Es decir, la muestra se ordena comoy (1) ,y (2) , ...,y (n)5 dondey (1) es la observacion 

menor, y (2) es la segunda observacidn menor, y asi sucesivamente, con y (n) la mayor. Las observaciones or- 
denadasy^ se grafican entonces contra sus respectivas frecuencias acumuladas observadas (j - 0.5)/n, La 
escala de la frecuencia acumulada se ha dispuesto de tal modo que si la distribucidn hipotetizada describe 
de manera adecuada los datos, los puntos graficados estar&n aproximadamente sobre una lmea recta; si 
los puntos graficados muestran una desviacidn significativa de una recta, el modelo hipotetizado no es 
apropiado, Generalmente, determinar si los datos graficados pertenecen o no a una recta es una decisidn 
subjetiva. 

Para ilustrar el procedimiento, suponga que quiere verificarse el supuesto de que la fuerza de la ten- 
sion de adhesidn en el experimento de la formulacidn del mortero de cemento portland sigue una distri- 
bucidn normal. Inicialmente sdlo se consideran las observaciones de la formulacidn del mortero sin 
modificar, En la figura 2-11 a se ilustra una gr&fica de probabilidad normal generada por computadora. La 
mayorfa de las graficas de probabilidad normal muestran 100 (j - 0.5)/n en la escala vertical izquierda (y en 
ocasiones se muestra 100[1 - (j - 0.5)/n] en la escala vertical derecha), con el valor de la variable graficado 
en la escala horizontal. Algunas graficas de probabilidad normal convierten la frecuencia acumulada en 
un valor z normalizado. Una lmea recta, elegida de manera subjetiva, se ha trazado en medio de los pun- 
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b) Mortero modrficado 

Figura 2-11 Gr£ficas de probabilidad normal de la fuerza de la tension de 
adhesi6n en el experimento del cemento portland. 


tos graficados. A1 trazar la linea recta, uno deber£ guiarse mas por los puntos de la parte media de la grdfi- 
ca que por los puntos extremos. Una buena regia empirica es trazar la recta aproximadamente entre los 
puntos de los cuartiles 25 y 75* Asi se determind la recta de la figura 2-lla. Para evaluar la “proximidad” 
de los puntos a la lmea recta, imagine un l£piz grueso colocado sobre la recta. Si este l&piz imaginario cu- 
bre todos los puntos, entonces una distribucidn normal describe de manera adecuada los datos. Puesto 
que los puntos de la figura 241a pasarian la prueba del l£piz grueso, se concluye que la distribucidn nor- 
mal es un modelo apropiado para la fuerza de la tensidn de adhesion del mortero sin modificar. En la fi- 
gura 2-11 b se presenta la grifica de probabilidad normal para las 10 observaciones de la fuerza de la 
tensidn de adhesidn del mortero modificado. De nueva cuenta, se concluiria que es razonable el supuesto 
de una distribution normal. 

Es posible obtener una estimacidn de la media y la desviaci6n estftndar directamente de la gr&fica de 
probabilidad normal. La media se estima como el percentil 50 de la gr&fica de probabilidad y la desviacidn 
estandar se estima como la diferencia entre los percentiles 84 y 50. Esto significa que el supuesto de la 
igualdad de las varianzas poblacionales en el experimento del cemento portland puede verificarse compa- 
rando las pendientes de las dos rectas de las figuras 2-1 la y 2- lift. Ambas rectas tienen pendientes muy si- 
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milares, por lo que el supuesto de la igualdad de las varianzas es razonable. Si se viola este supuesto, 
debera usarse la version de la prueba t que se describe en la section 2-4.4. En el material suplementario 
del texto hay mas informacidn acerca de la verification de los supuestos de la prueba t. 

Cuando ocurren violaciones importantes de los supuestos, se afectard el desempeno de la prueba t. 
En general, las violaciones de pequehas a moderadas no son motivo de preocupacion particular, pero no 
deberd ignorarse cualquier falla del supuesto de independencia, asi como los indicios claros de que no se 
satisface el supuesto de normalidad. Tdnto el nivel de signification de la prueba como la capacidad para 
detectar diferencias entre las medias seran afectados adversamente por el incumplimiento de estos su- 
puestos. Un recurso para resolver este problema son las transformaciones. Este tema se analiza con ma- 
yor detalle en el capitulo 3. Tambitii es posible utilizar procedimientos no parametricos para la prueba de 
hipotesis cuando las observaciones provienen de poblaciones no normales. Referirse a Montgomery y 
Runger [83d] para mds detalles. 


Una justification alternativa de la prueba t 

La prueba t de dos muestras que acaba de presentarse depende en teoria del supuesto fundamental de 
que las dos poblaciones de las que se seleccionaron las muestras al azar son normales. Aun cuando el su- 
puesto de normalidad es necesario para desarrollar formalmente el procedimiento de prueba, como ya 
se menciono, las desviaciones moderadas de la normalidad no afectaran seriamente los resultados. Puede 
argumentarse (por ejemplo, ver Box, Hunter y Hunter [18]) que el uso de un disebo aleatorizado 
permite probar hipotesis sin ningun supuesto respecto de la forma de la distribution. En resumen, el razo- 
namiento es el siguiente. Si los tratamientos no tienen ningun efecto, todas las [20!/(10! 10!)] = 184,756 
formas posibles en que podrian ocurrir las 20 observaciones son igualmente posibles. Hay un valor de f 0 
para cada uno de estos 184,756 posibles arreglos. Si el valor de t 0 que se obtiene en realidad de los datos es 
inusualinente grande o inusualmente pequeno con referenda al conjunto de los 184,756 valores posibles, 
es una indicacidn de que ^ // 2 . 

A este tipo de procedimiento se le llama prueba de aleatorizacidn. Puede demostrarse que la prueba 
t es una buena aproximacion de la prueba de aleatorizacion. Por lo tanto, se usar£n aqm pruebas t (y otros 
procedimientos que pueden considerarse aproximaciones de pruebas de aleatorizacion) sin prestar de- 
masiada atencidn al supuesto de normalidad. Esta es una de las razones por las que un procedimiento 
simple, como las graficas de probabilidad normal, es adecuado para verificar el supuesto de normalidad. 


2*4.2 Election del tamano de la muestra 

La eleccidn de un tamano de la muestra apropiado es uno de los aspectos mas importantes de cualquier 
problema de diseno experimental. La eleccidn del tamano de la muestra y la probabilidad fi del error tipo 
II guardan una estrecha relacidn. Suponga que se est&n probando las hipotesis 

Hq'.ji, =p 2 

HrVi 

y que las medias no son iguales, por lo que <5 = fi x -^ 2 , Puesto que/fo^ = no es verdadera, la preocupa- 
cion principal es cometer la equivocation de no rechazar H 0 . La probabilidad del error tipo II depende de 
la verdadera diferencia en las medias d. A una grafica de ft contra <5 para un tamano particular de la mues- 
tra se le llama la curva de operacidn caractenstica, o curva OC, de la prueba. El error tambien es una 
funcidn del tamano de la muestra. En general, para un valor dado de <3, el error se reduce cuando el ta- 
mano de la muestra se incrementa. Es decir, es m£s f£cil detectar una diferencia especificada en las me- 
dias para tamanos grandes de la muestra que para los tamanos pequenos. 
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Fn la figura 2-12 se muestra un juego de curvas de operacidn caractenstica para las hipotesis 


para el caso en que las dos varianzas poblacionales of y of son desconocidas pero iguales (of = o\ = o 2 ) 
y para un nivel de signification de a = 0.05. Las curvas tambien parten del supuesto de que los tamanos de 
las muestras de las dos poblaciones son iguales; es decir, n t = n 2 = n. El pardmetro del eje horizontal de la 
figura 2-12 es 


d _\jhI±A 

2o 


\A 

2 a 


La divisi6n de | <5 1 por 2 o permite al experimentador usar el mismo juego de curvas, independientemente 
del valor de la varianza (la diferencia en las medias se expresa en unidades de desviacidn est&ndar). Por 
otra parte, el tamano de la muestra usado para construir las curvas es en realidad n* = 2n - 1, 

Al examinar estas curvas, se observa lo siguiente: 


1. Entre mas grande sea la diferencia en las medias, fa- fa? menor ser& la probabilidad del error tipo II 
para un tamano de la muestra y un valor de a dados* Es decir, para un tamano de la muestra y un valor 
de a espedficados, la prueba detectara con mayor facilidad las diferendas grandes que las pequenas. 

2. Cuando el tamano de la muestra se hace m^s grande, la probabilidad del error tipo II se hace m&s pe- 
quena para una diferenda en las medias y un valor de a dados. Es decir, para detectar una diferencia 
<5 espedficada, puede aumentarse la potencia de la prueba incrementando el tamano de la muestra. 

Las curvas de operacidn caractenstica son con frecuencia utiles para seleccionar el tamano de la 
muestra que debe usarse en un experimento. Por ejemplo, considere el problema del mortero de cemento 
Portland comentado antes* Suponga que si las dos formulaciones difieren en la fuerza promedio hasta en 
0.5 kgf/cm 2 , seria deseable detectarlo con una probabilidad alta* Por lo tanto, puesto que ju x - [i 2 — 



Figura 2-12 Curvas de operacidn caractenstica para la prueba t de dos 
colas con a = 0.05. (Reproducida con permiso de "Operating Characte- 
ristics Curves for the Common Statistical Tfests of Significance”, C,L. Fe- 
rris, F.E. Grubbs y C.L. Weaver, Annals of Mathematical Statistics.) 
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0.5 kgfycm 2 es la diferencia “critica” en las medias que quiere detectarse, se encuentra que d, el pardmetro 
del eje horizontal de la curva de operacion caracterfstica de la figura 2-12, es 

^ _ \f*\ ~ ^2 1 __ 0-5 _ 0.25 
2 a 2a a 


Desafortunadamente, d incluye al pardmetro desconocido a. Sin embargo, suponga que con base en la ex- 
perience previa se piensa que es altamente improbable que la desviacidn estandar de cualquiera de las 
observaciones de la fuerza exceda 0.25 kgf/cm 2 . Entonces al usar a = 0.25 en la expression anterior para d 
se obtiene d = 1. Si quiere rechazarse la hipotesis nula 95% de las veces cuando/Zj -u 2 = 0.5, entonces P = 
0.05, y en la figura 2-12 con fi = 0.05 y d = 1 se obtiene n* - 16, aproximadamente. Por lo tanto, puesto 
que n* = 2n - 1, el tamano de la muestra requerido es 


n = 


n* + l 
2 


16+1 

2 


&5=9 


y se usarian los tamanos de las muestras n x — n 2 = n = 9. 

En el ejemplo que se ha venido considerando, el experimentador utilizd en realidad un tamano de la 
muestra de 10. Quizes el experimentador decidio incrementar ligeramente el tamano de la muestra a fin 
de prevenir la posibilidad de que la estimacidn previa de la desviackm estdndar comun a haya sido dema- 
siado conservadora y quiza fuera im poco mayor que 0.25. 

Las curvas de operacion caracterfstica desempenan con frecuencia un papel importante en la elec- 
ci6n del tamano de la muestra en los problemas de diseno experimental. Su utilizacion a este respecto se 
revisa en capftulos subsecuentes. Para un an&lisis de los usos de las curvas de operacion caracterfstica en 
otros experimentos comparativos simples similares a la prueba t de dos muestras, vease Montgomery y 
Runger [83d]. 


2-4.3 Intervalos de confianza 

Aun cuando la prueba de hipdtesis es un procedimiento util, en ocasiones no cuenta la historia completa. 
Muchas veces es preferible proporcionar un intervalo dentro del cual cabrfa esperar que estaria incluido 
el valor del par&metro o los parimetros en cuestion. A las declaraciones de estos intervalos se les llama in- 
tervalos de confianza. En muchos experimentos de ingenierfa e industriales, el experimentador sabe de 
antemano que las medias fi l y/r 2 difieren; por consiguiente, la prueba de la hipotesis /x 1 = fx 2 es de escaso 
interns. Por lo general el experimentador estaria mas interesado en un intervalo de confianza para la dife- 
rencia en las medias /i 1 - /i 2 . 

Para definir un intervalo de confianza, suponga que 0 es un pardmetro desconocido. Para obtener 
una est i in acid n del intervalo de 6, es necesario encontrar dos estadfsticosL y U tales que la declaracidn de 
probabilidad 

P(L<0<U)=l-a (2-27) 

sea verdadera. Al intervalo 

L<:6<U (2-28) 

se le llama intervalo de confianza de 100(1 - a) por ciento para el par&metro 8. La interpretacion de este 
intervalo es que si, en muestreos aleatorios repetidos, se construye gran numero de estos intervalos, 100(1 
— a ) por ciento de ellos contendrdn el verdadero valor de 8. A los estadfsticos Ly Use. les llama los lfmites 
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de confianza inferior y superior, respectivamente, y a 1 - a se le llama el coeficiente de confianza. Si a = 
0.05, a la ecuacidn 2-28 se le llama intervalo de confianza de 95% para 6. Observe que los intervalos de 
confianza tienen una interpretation de frecuencia; es decir, no se sabe si la declaration es verdadera para 
esta muestra especifica, pero si se sabe que el mOtodo usado para generar el intervalo de confianza produ- 
ce declaraciones correctas en 100(1 - a) por ciento de las veces. 

Suponga que quiere encontrarse un intervalo de confianza de 100(1 -a) por ciento para la verdadera 
diferencia de las medias -fi 2 en e l problema del cemento portland. El intervalo puede deducirse de la 
siguiente manera. El estadistico 


yi-h-fa-Pi) 



se distribuye como t n +n ^ 2 . Por lo tanto. 


^ ail , «! t m 2 -2 — 


yi - y 2 


T_HT 

’V«i n 2 


St 


a/2, +Bj — 2 


= l-a 


p\yi-yi- t a n,n l+n 2 - 2 Sp,— + —*t*i-!*i 


/]“ T 

V"l n 2 


* ~ + * "12^-2* P A + ~ 1 = 


A1 comparar las ecuaciones 2-29 y 2-27, se observa que 


_ fl 1 


(2-29) 


(2-30) 


es un intervalo de confianza de 100(1 - a) por ciento para fi x - fi 2 . 

La estimation real del intervalo de confianza de 95% para la diferencia en la fuerza de la tension de 
adhesidn promedio de las formulationes del mortero de cemento portland se encuentra haciendo la si- 
guiente sustituciOn en la ecuatiOn 2-30: 

16.76- 17.92- (2.101)0.284^+^ S ~n 1 

< 16.76- 17.92+(2.101)0.284 A /^H 
-1.16- 0.27 Sn^fi 2 £-1.16+0.27 
-1 £-0.89 

Por lo tanto, el intervalo de confianza de 95% estimado para la diferencia en las medias se extiende de 
-1.43 kgf/cm 2 a -0.89 kgf/cm 2 . Expresado en otros terminos, el intervalo de confianza es^ -fi 2 = -1.16 
kgf'cm 2 ± 0.27 kgf/cm 2 , o la diferencia en las fuerzas promedio es -1.16 kgf/cm 2 , y la precision de esta esti- 
mation es de ±0.27 kg f / cm 2 . Ohserve que como fi x ~/i 7 = 0 no esta incluida en este intervalo, los datosno 
apoyan la hipOtesis de que^j = fi 2 con el nivel de signification de 5%. Es probable que la fuerza media de 
la formulaciOn sin modificar exceda la fuerza media de la formulation modificada. Observe que en la ta- 
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bla 2-2 Minitab tambidn reportd este intervalo de ccnfianza cuando se llevd a cabo el procedimiento de la 
prueba de hipdtesis. 


2-4.4 Caso en que o\ 5* a\ 

Si se est& probando 

H 0 -Hi = Hi 


y no hay bases para suponer que las varianzas a\ya\ son iguales, entonces es necesario hacer ligeras mo- 
dificadones en la prueba t de dos muestras. En este caso el estadistico de prueba es 


?i-y 2 



(2-31) 


Este estadistico no se distribuye exactamente como t. No obstante, t es una buena aproximacion de la dis- 
tribuci6n de t 0 si se usa 




n t - 1 n 2 - 1 


(2-32) 


para los grados de libertad. Una indicacidn clara de la desigualdad de las varianzas en una grafica de pro- 
babilidad normal seria una situacidn que requeriria esta version de la prueba t. El lector no debera encon- 
trar problemas para desarrollar una ecuacion para encontrar ese intervalo de confianza para la diferencia 
en las medias en el caso de varianzas desiguales. 


2-4.5 Caso en que se conocen a\ y a\ 

Si las varianzas de ambas poblaciones se conocen, entonces las hipdtesis 


pueden probarse utilizando el estadistico 



yi~yi 



(2-33) 


Si ambas poblaciones son normales, o si los tamahos de las muestras son lo suficientemente grandes para 
aplicar el teorema del limite central, la distribuci6n de Z 0 es N( 0, 1) si la hipdtesis nula es verdadera. Por 
lo tanto, la regidn critica se encontraria utilizando la distribucion normal en lugar de la distribucidn t. 
Especificamente, H 0 se rechazaria si | Z 0 1 > Z a/2 , donde Z a/2 es el punto porcentual a/2 superior de la dis- 
tribucidn normal estandar. 
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A diferencia de la prueba t de las secciones anteriores, en la prueba de las medias con varianzas cono- 
cidas no se requiere el supuesto de que el muestreo se haga de poblaciones normales, Puede aplicarse el 
teorema del limite central para justificar una distribucidn normal aproximada para la diferencia en las 
medias muestrales - y 2 . 

El intervalo de confianza de 100(1 -a) por ciento para/^i cuando las varianzas se conocen es 


y ,-? 2- z «/2 



<fj. : -n 2 < yi -y 2 +Z al2 



(2-34) 


Como ya se senald, el intervalo de confianza es con frecuencia un complemento util del procedimiento de 
prueba de hipdtesis. 


2-4.6 Comparaci6n de una sola media con un valor especificado 

Algunos experimentos incluyen la comparacidn de la media ft de una sola poblacidn con un valor especifi- 
cado, por ejemplo /u 0 . Las hipdtesis son 


H 0 :f* = H 0 


Si la poblacidn es normal con varianza conocida, o si la poblacion no es normal pero el tamano de la mues- 
tra es lo suficientemente grande para aplicar el teorema del limite central, entonces la hipotesis puede 
probarse utilizando una aplicacidn directa de la distribucion normal. El estadistico de prueba es 


■ 

0 olS 


(2-35) 


Si // 0 :// = /t 0 es verdadera, entonces la distribucion de Z 0 es N(0, 1). Por lo tanto, la regia de decision para 
H 0 :fi = Ho es rechazar la hipotesis nula si | Z 0 j > Z a , 2 . El valor de la media fi 0 especificado en la hipdtesis 
nula se determina por lo general mediante una de las tres formas siguientes. Puede ser resultado de evi- 
dencia, conocimientos o experimentacion previos. Puede ser resultado de alguna teoria o modelo que 
describe la situacidn bajo estudio. Por ultimo, puede ser resultado de especificaciones contractuales. 

El intervalo de confianza de 100(1 - a) por ciento para la verdadera media poblacional es 

y~Z an o/>fn<n<y+Z an olJn (2-36) 


EJEMPLO 2-1 

Un proveedor ofrece lotes de tela a un fabricante de textiles. El fabricante desea saber si la resistencia a la 
ruptura promedio excede 200 psi. De ser asi, el fabricante aceptar& el lote. La experiencia pasada indica 
que un valor razonable para la varianza de la resistencia a la ruptura es lOO(psi) 2 . Las hipotesis que debe- 
r&n probarse son 

H 0 \/i = 200 
H 1 : f i> 200 

Observe que se trata de una hipdtesis altemativa de una cola. Por lo tanto, el lote se aceptaria s61o si la hi- 
pdtesis nula H 0 :fi = 200 pudiera rechazarse (es decir, si Z 0 > Z a ). 


46 CAPITULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES 


y 


Se seleccionan cuatro ejemplares aleatoriamente, y la resistencia a la ruptura promedio observada es 
214 psi. El valor del estadfstico de prueba es 


Z 0 


y~p 0 _ 214- 200 _ 
ol4n~ 10/V4 


Si se especifica un error tipo I de a = 0.05, en la tabla I del ap6ndice se encuentra que Z a = Z 0 05 = 1.645, 
Por lo tanto,/f 0 se rechazay se concluye que la resistencia a la ruptura promedio del lote excede 200 psi. 


Cuando no se conoce la varianza de la poblacidn, es necesario establecer el supuesto adicional de que 
la poblacidn sigue una distribucidn normal, aunque las desviaciones moderadas de la normalidad no afec- 
tar£n seriamente los resultados. 

Para probar H 0 :pi = pi 0 en el caso de la varianza desconocida, se usa la varianza muestral S 2 para esti- 
mar o 2 . A1 sustituir a con S en la ecuacidn 2-35, se obtiene el estadfstico de prueba 


*0 


y-p o 

S/Jit 


(2-37) 


La hipdtesis nula H 0 : fi = ft 0 se rechazaria si |f 0 | > t afZi „ _ 1# donde t an ,„_ i denota el punto porcentual all 
superior de la distribution t con n - 1 grados de libertad. El intervalo de confianza de 100(1 - a) por tiento 
es en este caso 


y~ tan.n-iS / ^ P * y+K, z,n-iS / Vn 


(2-38) 


2'4.7 Resumen 

En las tablas 2-3 y 2-4 se resumen los procedimientos de prueba estudiados aqui para las medias muestra- 
les. Se muestran las regiones criticas para hipdtesis altemativa tanto de una como de dos colas. 


labia 2-3 Pruebas para medias con varianza conocida 


Hipdtesis 

H 0 :m = fi 0 
HvP<Po 
H 0 :p=fi 0 

= P 2 
Hi’Mi *P i 
Ha-hi = Pi 
HvH x < Pi 


Estadfstico de prueba Criterios de rechazo 


r _ y-pQ 

0 a l 4n 




°1 °2 

V«1 n 2 


\Zo\ >Z a/2 
Z 0 <-Z a 

z 0 >z a 

\z„\>z a/2 


z„<-z a 


Z„>Z a 


H of*l = Pl 
H x :p x > Pi 
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Tabla 2-4 Pruebas para medias de distribuciones normales, 
varianza desconocida 


Hipdtesis 

Estadfstico de prueba 

Criterios de rechazo 



U 0 \> 

H 0 :n=/i 0 

. ?-fi 0 
ta ~ S/ -Jn 

1 

M 0 :fi =H a 
H.ifi > 


*0 ^ ^ a 


Si CTj = a\ 


Ho-fr =fi 2 

i *fi 2 

h ~h 

0 „ pr^r 

p \n 1 + n 2 

|tol> to/2,B 


v =/*! + n 2 -2 



si o\ * o\ 


^0*^1 ~ t*2 

Hi-Hr < 

- _ %-y . 

°" X + sL 

to < ~‘a.v 


V”l n 2 


Ho-Ht =fi 2 

n 2 n i > n 2 


to > t a ,„ 


($i / 'h f . (Sl/n 2 f 
n i-l w 2 -l 



2-5 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS, 

DISENOS DE COMPARACIONES PAREADAS 

2-5.1 El problema de las comparaciones pareadas 

F.n algunos experimentos comparativos simples puede conseguirse un mejoramiento significativo de la 
precisidn haciendo comparaciones de observaciones pareadas del material experimental. Por ejemplo, 
considere una maquina para probar la dureza que presiona una barra con una punta afilada sobre un 
ejemplar de prueba de metal con una fuerza conocida. A1 medir la profundidad de la depresion producida 
por la punta, se determina la dureza del ejemplar de prueba. En esta maquina pueden instalarse dos pun- 
tas diferentes y aun cuando la precisidn (la variabilidad) de las mediciones hechas con las dos puntas pa- 
rece ser la misma, se sospecha que una de las puntas produce diferentes lecturas de la dureza que la otra. 

Seria posible realizar un experimento de la siguiente manera. Podrian seleccionarse al azar varios 
ejemplares de prueba del metal (por ejemplo, 20). La mitad de estos ejemplares de prueba podrian pro- 
barse con la punta 1 y la otra mitad con la punta 2. La asignacidn exacta de los ejemplares a las puntas se 
determinarfa de manera aleatoria. Puesto que se trata de un diseno completamente aleatorizado, la dure- 
za promedio de las dos muestras podrfa compararse utilizando la prueba t descrita en la seccidn 2-4. 

Al reflexionar un poco al respecto, se descubriria una seria desventaja del diseno completamente 
aleatorizado en este problema. Suponga que los ejemplares de prueba del metal se cortaron de barras di- 


48 CAPfrULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES 


ferentes que se fabricaron a temperaturas diferentes o que no fueran exactamente homogcncos en cual- 
quier otra forma que pudiera afectar la dureza. Esta falta de homogeneidad entre los ejemplares 
contribuira a la variabilidad de las mediciones de la dureza y tendera a inflar el error experimental, ha- 
ciendo m&s dificil detectar una diferencia real entre las puntas. 

Para protegerse de estaposibilidad, considere un diseno experimental altemativo. Suponga que cada 
ejemplar de prueba tiene el tamano suficiente para que puedan hacerse en 61 dos determinaciones de la 
dureza. Este diseno alternativo consistiria en dividir cada ejemplar de prueba en dos secciones, para des 
pu6s asignar de manera aleatoria una punta a una mitad de cada ejemplar de prueba y la otra punta a la 
otra mitad. El orden en que se prueban las puntas en un ejemplar de prueba particular se seleccionaria al 
azar. El experimento, cuando se llevo a cabo de acuerdo con este diseno con 10 ejemplares de prueba, 
produjo los datos (codificados) que se muestran en la tabla 2-5. 

Un modelo estadistico que describe los datos de este experimento puede expresarse como 


y,=Mi+Pj+e 


{*■ = 1,2 

ii \j = 1,2,.. 


., 10 


(2-39) 


donde>', ; es la observation de la dureza para la punta i en el ejemplar de prueba j , /<, es la verdadera dureza 
promedio de la punta j-dsima,^, es un efecto sobre la dureza debido al ejemplar de prueba j-esimo, y s (/ es 
el error experimental aleatorio con media cero y varianza < 7 2 . F.s decir, a j es la varianza de las mediciones 
de la dureza hechas con la punta 1 y a \ es la varianza de las mediciones de la dureza hechas con la punta 2. 

Observe que si se calcula la diferencia pareada y-6 sima 

dj = y u ~ y 2j j = 1,2,..., 10 (2-40) 

el valor esperado de esta diferencia es 

(*a — E(dj ) 

= E{y lj -y v ) 

= E( yij )-E{y 2 j) 

= t*i+Pj 
= /*! 2 


Es decir, pueden hacerse infcrencias acerca de la diferencia en las lecturas de la dureza promedio de las 
dos puntas /tj -fi 2 haciendo inferencias acerca de la media de las diferencias fi d . Observe que el efecto adi- 


Tabla 2-5 Datos del experimento de 
la prueba de la dureza 

Ejemplar de prueba 

Punta 1 

Punta 2 

1 

7 

6 

2 

3 

3 

3 

3 

5 

4 

4 

3 

5 

8 

8 

6 

3 

2 

7 

2 

4 

8 

9 

9 

9 

5 

4 

10 

4 

5 
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tivo de las fy de los ejemplares de prueba se cancela cuando las observaciones estan pareadas de esta ma- 
nera. 

Probar H 0 \ji t es equivalente a probar 

H 0 :ft d = 0 

Hyii d *Q 

El estadfstico de prueba para esta hipotesis es 

d 




donde 


es la media muestral de las diferencias y 


S d = 


0 5,/Vn 


3 = -Yd, 

n J-l 


2 (.dj-df 
1*1 

1/2 

S',4(2x] 

/•-I n \M J 

2 " 

n - 1 


n-1 



|l/2 


(2-41) 

(2-42) 

(2-43) 


es la desviacidn est&ndar muestral de las diferencias. H 0 : u d = 0 se rechazaria si |/ 0 | > tan, n - 1 - Debido a 


que las observaciones de los niveles del factor estdn 
cedimiento suele llamarsele prueba t pareada. 
Por los datos de la tabla 2-5, se encuentra 

d x = 7-6=1 

d 2 = 3-3=0 
d } = 3- 5 = -2 
d 4 =4-3=1 
d } =8-8=0 


pareadas” en cada unidad experimental, a este pro 

d 6 =3-2=1 
d 7 = 2-4 = -2 
d 8 = 9-9=0 
d 9 =5-4=1 

dio=4-5=-l 


Por lo tanto, 




np 


S d = 


10 ' 

( 


n i / n 

y y d 

E .phifcaLf.,, 

n- 1 J L 10-1 J 


Suponga que se elige a = 0.05. Entonces, para tomar una decisidn se calcularfa t 0 y H 0 se rechazaria si |f 0 | 

to. 025, 9 = 2.262. 

El valor calculado del estadfstico de prueba t pareada es 


d 

t(> ~ S d /yfH 
- 0.10 

“ 1 . 20 / VTo 

= -0.26 
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Figura 2-13 La distribuci6n de referenda (f con 9 grados de libertad) 
para el problema de la prueba de la dureza. 


y como 1 1 0 1 = 0.26 t 0ja2Si 9 = 2.262, la hip6tesis H 0 :p d = 0 no puede rechazarse. Es decir, no hay evidencia 
que indique que las dos puntas producen lecturas de la dureza diferentes. En la figura 2-13 se muestra la 
distribution de f 0 con 9 grados de libertad, la distribucion de referenda para esta prueba, con el valor de t 0 
indicado en relacidn con la regidn critica. 

En la tabla 2-6 se muestra la salida de computadora del procedimiento para la prueba t pareada de 
Minitab para este problema. Observe que el valor P para esta prueba es P— 0.80, lo cual implica que no 
puede rechazarse la hipdtesis nula con ningun nivel de significad6n razonable. 


2-5.2 Ventajas del diseno de comparaciones pareadas 

A1 diseiio que se utilizd en realidad para este experimento se le llama diseno de comparaciones pareadas, 
el cual ilustra el principio de la formacidn de bloques comentado en la section 1-3. De hecho, es un caso 
especial de un tipo de diseno mds general llamado diseno de bloques aleatorizados. El termino bloque se 
refiere a una unidad experimental relativamente homogenea (en el caso tratado aquf, los ejemplares 
de prueba del metal son los bloques), y el bloque representa una restriccidn sobre la aleatorizaci6n com- 
pleta debido a que las combinaciones de los tratamientos s61o se aleatorizan dentro del bloque. En el ca- 
pftulo 4 se examina este tipo de disehos. En dicho capitulo el modelo matem&tico del diseiio, la ecuacidn 
2-39, se escribe en una forma ligeramente diferente. 


Tabla 2-6 Resultados de Minitab de la prueba t pareada para el ejemplo de la prueba de la dureza 

Prueba t pareada e intervalo de confianza 

Paired T for Tip 1 - Tip 2 



N 

Mean 

StDev 

SE Mean 

Tip 1 

10 

4.800 

2.394 

0.757 

Tip 2 

10 

4.900 

2.234 

0.706 

Difference 

10 

-0.100 

1.197 

0.379 


95% Cl for mean difference: (-0.956, 0.756) 
t-Test of mean difference = 0 (vs not = 0): 
T-Value = -0.26 P-VaLue = 0.798 
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Antes de dejar este experimento, es necesario destacar varios puntos. Observe que, aun cuando se 
han hecho 2 n = 2(10) = 20 observations, se cuenta unicamente con n - 1 = 9 grados de libertad para el 
estadistico t. (Se sabe que conforme se incrementan los grados de libertad para r, la pnxeba se hace m&s 
sensible*) A1 hacer la formation de bloques o pareo, se han “perdido” en realidad n - 1 grados de libertad, 
pero se espera haber ganado un mejor conocimiento de la situacidn al eliminar una fuente adicional de 
variabilidad (la diferencia entre los ejemplares de prueba), Puede obtenerse una indicacidn de la calidad 
de la information producida por el diseno pareado comparando la desviacidn est&ndar S d de las diferen- 
cias con la desviatidn est^ndar combinada S p que habria resultado si el experimento se hubiera conducido 
de manera completamente aleatorizada y se hubieran obtenido los datos de la tabla 2-5 . Al utilizar los da- 
tos de la tabla 2-5 como dos muestras independientes, la desviacion estandar combinada que se calcula 
con la ecuacion 2-25 es S p = 2.32. Al comparar este valor con S d = 1.20, se observa que la formation de 
bloques o pareo ha reducido la estimaciOn de la variabilidad en cerca de 50%. Esta information tambiOn 
puede expresarse en tOrminos de un intervalo de confianza para/ij -// 2 - Utilizando los datos pareados, un 
intervalo de confianza de 95% para^ x - pt 2 es 

^ — ^0.025 , ^ 

-0.10±(2.262)(1.20)/VlO 
— 0 . 10 ± 0.86 


Retiprocamente, al utilizar el an&lisis combinado o independiente, un intervalo de confianza de 95% 
para ji x - fi 2 es 

±‘ 0 . 025 ,^, -J- + — 

4 . 80 - 4 . 90 ±( 2101 )( 232 ) V ^+^ 

- 0.10 ± 2.18 

El intervalo de confianza basado en el an Ali sis pareado tiene una anchura sensiblemente menor que el in- 
tervalo de confianza del an&lisis independiente. Esto ilustra la propiedad de reduccion del ruido de la for- 
macion de bloques. 

La formacion de bloques no es siempre la mejor estrategia de diseno. Si la variabilidad dentro de los 
bloques es la misma que la variabilidad entre los bloques, la varianza dey t -y 2 ser& la misma independien- 
temente del diseno que se use. De hecho, la formacidn de bloques en esta situaci6n seria una eleccion de 
diseno pobre porque la formaci6n de bloques produce la p6rdida den - 1 grados de libertad y llevara en 
realidad a un intervalo de confianza con una anchura mayor para/r, -fi 2 . En el capitulo 4 se ofrece una re- 
visidn mas amplia de la formacidn de bloques. 


2-6 INFERENCES ACERCA DE LAS VARIANZAS 
DE DISTRIBUCIONES NORMALES 

En muchos experimentos, el interes se encuentra en las posibles diferencias en la respuesta media de dos 
tratamientos. Sin embargo, en algunos experimentos es la comparacidn de la variabilidad en los datos lo 
que es importante. En la industria de alimentos y bebidas, por ejemplo, es importante que la variabilidad 
del equipo de llenado sea pequena para que todos los empaques esten cerca del peso neto nominal o el 
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volumen del contenido neto nominal. En los laboratories quunicos, tal vez quiera compararse la variabili- 
dad de dos metodos de analisis. A continuacion se examinan brevemente las pruebas de hipotesis y los in- 
tervalos de confianza para las varianzas de distribuciones normales. A diferencia de las pruebas para las 
medias, los procedimientos para las pruebas de varianzas son bastante m&s sensibles al supuesto de nor- 
malidad. En el apendice 2A de Davies [36] hay un buen analisis del supuesto de normalidad. 

Suponga que quiere probarse la hipdtesis de que la varianza de una poblacidn normal es igual a una 
constante, por ejemplo, a\. Expresado en terminos formales, quiere probarse 


H 0 \o 2 =a\ 

H x -.o 2 *o\ 


(2-44) 


El estadistico de prueba para la ecuacion 2-44 es 


55 (n-l)5 2 

Xo a 2 a 2 

u o u o 


(2-45, 


donde SS = — y) 2 es la suma de cuadrados corregida de las observaciones muestrales. La distribu- 

ci6n de referencia apropiada para esla distribucion ji-cuadrada con n-1 grados de libertad. La hipdte- 
sis nula se rechaza si xl > xln,„-i osi Xo < xl {a / 2 ),r,-v donde xln, n -i V son los puntos porcentua- 
les a/2 superior y 1 - (a/2) inferior de la distribucion ji-cuadrada con n-1 grados de libertad, 
respectivamente. En la tabla 2-7 se presentan las regiones criticas para las hipdtesis alternativas de una 
cola. El intervalo de confianza de 100(1 - a) por ciento para a 2 es 


(n— 1)S 2 


<r 


An-\ )5 2 

Xl-(a/2),n-l 


(2-46) 


Considere ahora la prueba de la igualdad de las varianzas de dos poblaciones normales. Si se toman 
muestras aleatorias independientes de tamaiio n x y n 2 de las poblaciones 1 y 2, respectivamente, el estadis- 
tico de prueba para 


H ° :o 1-° 2 2 (2-47) 

H x '.a\ * o\ 

es el cociente de las varianzas muestrales 

Fo = §T (2-48) 

La distribucidn de referencia apropiada para F 0 es la distribucidn F con n x - 1 grados de libertad en el nu- 
merador y n 2 - 1 grados de libertad en el denominador. La hipdtesis nula se rechazaria si F 0 > F afl _ x 
O si F 0 < donde F a/ 2 , ni -i,n 2 -i y F i-(ai 2 ),n^i, ni -i denotan los puntos porcentuales a/2 superior 

y 1 - (a/2) inferior de la distribution F con n x - 1 y n 2 - 1 grados de libertad. En la tabla IV del apOndice 
s61o aparecen los puntos porcentuales para la cola superior de F; sin embargo, los puntos de las colas su- 
perior e inferior se relacionan por 


L l-tf.t*! ,V 2 


1 


( 2 - 49 ) 
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Tabla 2*7 Pruebas para las varianzas de distribuciones normales 


Hipdtesis 

Estadistico de prueba 

Criterios de rechazo 

H 0 :o 2 =a 2 0 
H{.a 2 


Xo > Xa(2sl-1 0 

Xo Xl-al2,n-l 

H a :a 2 = a 2 0 
H^o 2 < a 2 0 

(n-l)S J 

Xo ^ Xl— a/i— 1 

H 0 :o 2 =o 2 q 

HyO 2 > 


Xo > xL-1 

H 0 :ot =a\ 

HyO\*<j\ 

II 


H„:al — g\ 
B x \g\ < o\ 

II 


H 0 :al =a\ 
H x :ol > a\ 

It 

> Fa.n x - l/i 2 -l 


En el capitulo 3, section 3-4.3, se analizan los procedimientos de prueba para m&s de dos varianzas. Se re- 
visara tambi6n el uso de la varianza o la desviacidn est&ndar como variable de respuesta en situaciones ex- 
perimentales m&s generales. 


EJEMPLO 

Un ingeniero qufrnico investiga la variabilidad inherente de dos tipos de equipo de prueba que pueden 
usarse para monitorear la produccidn de un proceso. El ingeniero sospecha que el equipo antiguo, tipo 1, 
tiene una varianza mayor que la del equipo nuevo. Por lo tanto, quiere probar las hipdtesis 

>a\ 


Se toman dos muestras aleatorias de n r = 12 y n 2 = 10 observaciones, y las varianzas muestrales son S* — 
14.5 y Si ~ 10.8, El estadistico de prueba es 


10.8 


*1 


En la tabla IV del apendice se encuentra que F oos> a 9 = 3.10, por lo que no puede rechazarse la hipotesis 
nula. Es decir, se ha encontrado evidencia estadfstica insuficiente para concluir que la varianza del equipo 
antiguo sea mayor que la varianza del equipo nuevo. 


El intervalo de confianza de 100(1 - a) por ciento para el cociente de las varianzas poblacionales 
o 2 !a\ es 


Sf a . 2 S 2 „ 

i_ p < L < 1 p 

r l-al2 f n 2 -l,n x -l ~ ^2 ~ g2 1 


(2-50) 
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Para ilustrar el uso de la ecuacidn 2-50, el intervalo de confianza de 95% para el cociente de las varianzas 
a\ / a\ del ejemplo 2-2 es, utilizando F ow , 9n = 3.59 y F 0 . 97SAU = 1/F 0 .o2s,ii,9 = 1/3.92 = 0.255, 


® (a255 >4 s Si( i59 ) 


0.34 4.81 


2-7 PROBLEMAS 

2-1* Se requiere que la resistencia a la ruptura de una fibra sea de por lo menos 150 psi. La experiencia pasada in* 
dica que la desviacidn estdndar de la resistencia a la ruptura es a = 3 psi. Se prueba una muestra aleatoria de 
cuatro ejemplares de prueba, y los resultados son y 1 = 145, y 2 - 153, y 3 = 150 y y 4 = 147. 

a) Enunciar las hipdtesis que el lector considere que debenan probarse en este experimento. 

b) Probar estas hipdtesis utilizando a = 0.05. LA qu6 conclusiones se llega? 

c) Encontrar el valor P para la prueba del inciso b . 

d) Construir un intervalo de confianza de 95% para la resistencia a la ruptura promedio, 

2-2. Supuestamente, la viscosidad de un detergente lfquido debe promediar 800 centistokes a 25°C. Se colecta 
una muestra aleatoria de 16 lotes del detergente, y la viscosidad promedio es 812. Suponga que se sabe que la 
desviacidn est&ndar de la viscosidad es a = 25 centistokes. 

a) Enunciar las hipdtesis que deber£n probarse. 

b) Probar estas hipdtesis utilizando a = 0.05. LA qu6 conclusiones se llega? 

c) 6Cudl es el valor P para la prueba? 

d) Encontrar un intervalo de confianza de 95% para la media. 

2-3. Los di&metros de las flechas de acero producidas en cierto proceso de manufactura deber&n tener un prome- 
dio de 0.255 pulgadas. Se sabe que el didmetro tiene una desviacidn estdndar de a - 0.0001 pulgadas. Una 
muestra aleatoria de 10 flechas tiene un didmetro promedio de 0,2545 pulgadas, 

a) Establecer las hipdtesis apropiadas para la media pi. 

b) Probar estas hipdtesis utilizando a = 0.05. LA qu6 conclusiones se llega? 

c ) Encontrar el valor P para esta prueba, 

d) Construir un intervalo de confianza de 95% para el didmetro promedio de las flechas. 

2-4. Una variable aleatoria con una distribucidn normal tiene una media desconocida pi y varianza o 1 = 9, Encon- 
trar el tamano de la muestra que se necesita para construir un intervalo de confianza de 95% para la media, 
cuya anchura total sea de 1.0. 

2-5. La vida de anaquel de una bebida carbonatada es motivo de interds. Se seleccionan 10 botellas al azar y se 
prueban, obteni6ndose los siguientes resultados: 


Dias 

108 

138 

124 

163 

124 

159 

106 

134 

115 

139 


a) Quiere demostrarse que la vida media de anaquel excede los 120 dias. Establecer las hipdtesis apropia- 
das para investigar esta afirmacidn. 

b) Probar estas hipdtesis utilizando a = 0.01, LA que conclusiones se llega? 
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c) Encontrar el valor P para la prueba del inciso b. 

d) Construir un intervalo de confianza de 99% para la vida media de anaquel. 

2-6, Considere los datos de la vida de anaquel del problema 2-5, 6La vida de anaquel puede describirse o mode- 
larse adecuadamente con una distribucidn normal? iQu6 efecto tendria la violacidn de este supuesto sobre 
el procedimiento de prueba usado para resolver el problema 2-5? 

2-7. El tiempo para reparar un instrumento electrdnico es una variable aleatoria medida en horas que sigue una 
distribucidn normal. El tiempo de reparacidn de 16 de estos instrumentos elegidos al azar es el siguiente: 


Horas 

159 

280 

101 

212 

224 

379 

179 

264 

222 

362 

168 

250 

149 

260 

485 

170 


a) Quiere saberse si el tiempo de reparaci6n promedio excede 225 horas. Establecer las hipdtesis apropia- 
das para investigar esta cuestidn. 

b) Probar las hipdtesis que se formularon en el inciso a, l A qu£ conclusiones se llega? Utilizar a = 0.05. 

c) Encontrar el valor P para la prueba. 

d) Construir un intervalo de confianza de 95% para el tiempo de reparacidn promedio, 

2-8. Considere nuevamente los datos del tiempo de reparacidn del problema 2-7. En opinidn del lector , £el tiem- 
po de reparacidn puede modelarse de manera adecuada con una distribuci6n normal? 

2-9. Se utilizan dos mdquinas para llenar botellas de pldstico con un volumen neto de 16.0 onzas. Puede suponer- 
se que el proceso de llenado es normal, con desviaciones estdndar de o x = 0,015 y o 2 = 0.018. El departamen- 
to de ingenierfa de calidad sospecha que ambas mdquinas llenan el misxno volumen neto, sin importar si este 
volumen es 16.0 onzas o no. Se realiza un experiment tomando una muestra aleatoria de la produccidn de 
cada mdquina. 


Mdquina 1 Mdquina 2 


16.03 

16.01 

16.02 

16.03 

16,04 

15.96 

15.97 

16.04 

16.05 

15.98 

15.96 

16.02 

16.05 

16.02 

16.01 

16,01 

16.02 

15.99 

15.99 

16.00 


a) Enunciar las hipdtesis que deberdn probarse en este experimento. 

b) Probar estas hipdtesis utilizando a =? 0.05. i A qu£ conclusiones se llega? 

c) Encontrar el valor P para esta prueba. 

d) Encontrar un intervalo de confianza de 95 % para la diferencia en el volumen de llenado promedio de las 
dos mdquinas. 

2-10. Un fabricante de calculadoras electrdnicas puede usar dos tipos de pldstico. La resistencia a la ruptura de 
este pldstico es importante, Se sabe que o i = o 2 = 1 .0 psi. De muestras aleatorias de n i = 10 y n 2 = 12 se obtie- 
ne y x = 162.5 y y 2 = 155.0. La compania no empleara el pldstico 1 a menos que su resistencia a la ruptura ex- 
ceda la del pldstico 2 por al menos 10 psi. Con base en la informacidn muestral, 6deberd usarse el pldstico 1? 
Para responder esta pregunta se deben establecer y probar las hipdtesis apropiadas utilizando a = 0.01. 
Construir un intervalo de confianza de 99% para la verdadera diferencia media en la resistencia a la ruptura. 
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2-11- A continuaci6n se presenta el tiempo de combustidn de dos cohetes quimicos con formulaciones diferentes. 
Los ingenieros de diseno se interesan tanto en la media como en la varianza del tiempo de combustidn. 



Tipo 1 

Tipo 2 


65 

82 

64 

56 

81 

67 

71 

69 

57 

59 

83 

74 

66 

75 

59 

82 

82 

70 

65 

79 


a) Probar la hipdtesis de que las dos varianzas son iguales. Utilizar a = 0.05, 

b) Utilizando los resultados del inciso a , probar la hipdtesis de que los tiempos de combustion promedio 
son iguales. Utilizar a - 0.05. 6Cu£l es el valor P para esta prueba? 

c) Comentar el papel del supuesto de normalidad en este problems Verificar el supuesto de normalidad 
para ambos tipos de cohetes, 

2-12, En un artfculo de Solid State Technology , “Diseno ortogonal para optimizacidn de procesos y su aplicacidn en 
el grabado quimico con plasma” de G.Z. Yin y D.W, Jillie, se describe un experimento para determinar el 
efecto de la velocidad del flujo de C 2 F 6 sobre la uniformidad del grabado en una oblea de silicio usada en la 
fabricacidn de circuitos integrados, Los datos de la velocidad del flujo son los siguientes: 


Flujo de 



Observacidn de la uniformidad 



qf 6 

1 

2 

3 

4 

5 

6 

125 

2.7 

4,6 

2.6 

3.0 

3.2 

3.8 

200 

4.6 

3.4 

2.9 

3.5 

4.1 

5,1 


a) £La velocidad del flujo de C 2 F 6 afecta la uniformidad del grabado promedio? Utilizar a = 0,05. 

b) £Cu£l es el valor P para la prueba del inciso al 

c) £La velocidad del flujo de Q F 6 afecta la variabilidad de una oblea a otra en la uniformidad del grabado? 
Utilizar a = 0.05. 

d) Tbazar diagramas de caja que ayuden a interpretar los datos de este experimento. 

2-13. Se instala un nuevo dispositivo de filtrado en una unidad quimica. Antes de instalarlo, de una muestra alea- 
toria se obtuvo la siguiente informacidn sobre el porcentaje de impurezas: y x = 12.5, S* = 101.17 y - 8. 
Despuds de instalarlo, de una muestra aleatoria se obtuvo y 2 - 10.2, S \ = 94,73, n 2 - 9. 

a) 6Puede concluirse que las dos varianzas son iguales? Utilizar a = 0.05. 

b) £E1 dispositivo de filtrado ha reducido de manera significativa el porcentaje de impurezas? Utilizar a = 
0.05. 

2-14. Se hacen 20 observaciones de la uniformidad del grabado en obleas de silicio durante un experimento de eva- 
luacidn de un grabador de plasma. Los datos son los siguientes: 


5.34 

6.65 

4.76 

5.98 

7.25 

6.00 

7,55 

5.54 

5.62 

6.21 

5.97 

7.35 

5.44 

4.39 

4.98 

5.25 

6.35 

4.61 

6.00 

5.32 


a) Construir una estimacidn con un intervalo de confianza de 95% de a 2 , 

b) Probar la hipdtesis de que a 1 - 1.0. Utilizar a - 0.05. LA qu6 conclusiones se llega? 
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c) Comentar el supuesto de normalidad y su papel en este problema. 

d) Verificar la normalidad construyendo una grdfica de probabilidad normal, i A qu6 conclusiones se 
llega? 

2-15. Doce inspectores midieron el di&metro de un cojinete de bolas, utilizando cada uno dos tipos diferentes de 
calibradores. Los resultados fueron 


Inspector 

Calibrador 1 

Calibrador 2 

1 

0.265 

0.264 

2 

0.265 

0.265 

3 

0.266 

0.264 

4 

0.267 

0.266 

5 

0.267 

0.267 

6 

0.265 

0.268 

7 

0.267 

0,264 

8 

0.267 

0,265 

9 

0.265 

0.265 

10 

0.268 

0.267 

11 

0.268 

0.268 

12 

0.265 

0.269 


a) iExiste una diferencia significativa entre las medias de la poblacidn de mediciones de las que se seleccio* 
naron las dos muestras? Utilizar a = 0.05. 

b) Encontrar el valor P para la prueba del inciso <z. 

c) Construir un intervalo de confianza de 95% para la diferencia en las mediciones de los di&metros prome- 
dio para los dos tipos de calibradores. 

2-16. En un articulo de Journal of Strain Analysis (vol. 18, no. 2) se comparan varios procedimientos para predecir 
la resistencia al corte de vigas de placas de acero. Los datos para nueve vigas en la forma del cociente de la 
carga predicha y la observada para dos de estos procedimientos, los m£todos Karlsruhe y Lehigh, son los si- 
guientes 


Viga 

M6todo Karlsruhe 

M6todo Lehigh 

Sl/1 

1.186 

1.061 

S2/1 

1.151 

0.992 

S3/1 

1.322 

1.063 

S4/1 

1.339 

1.062 

S5/1 

1.200 

1.065 

S2/1 

1.402 

1.178 

S2/2 

1.365 

1.037 

S2/3 

1.537 

1.086 

S2/4 

1.559 

1.052 


a) IExiste alguna evidencia que apoye la afirmacidn de que hay una diferencia en el desempeho promedio 
entre los dos m£todos? Utilizar a = 0.05, 

b) 6Cu£ 1 es el valor P para la prueba del inciso al 

c) Construir un intervalo de confianza de 95 % para la diferencia en la carga promedio predicha y la obser- 
vada. 

d) Investigar el supuesto de normalidad en ambas muestras. 

e) Investigar el supuesto de normalidad para la diferencia en los cocientes para los dos m^todos. 

f) Comentar el papel del supuesto de normalidad en la prueba t pareada. 


58 CAPITULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES 

2-17. Se estudia la temperatura de deflexion bajo carga de dos formulaciones diferentes de un tubo de plistico 
ABS. Dos muestras de 12 observaciones cada una, se preparan utilizando cada formulacidn y las temperatu- 
ras de deflexibn (en °F) se presentan abajo: 


Formulacibn 1 Formulacibn 2 


206 

193 

192 

177 

176 

198 

188 

207 

210 

197 

185 

188 

205 

185 

194 

206 

200 

189 

187 

189 

178 

201 

197 

203 


a ) Construir las grdficas de probabilidad normal para ambas muestras. £Estas grdficas apoyan los supuestos 
de normalidad y de la igualdad de la varianza de ambas muestras? 

b) 6 Los datos apoyan la afirmacibn de que la temperatura promedio de deflexibn bajo carga de la formula- 
cibn 1 excede la de la formulacibn 2? Utilizar a = 0.05. 

c) £Cudl es el valor P para la prueba del inciso al 

2-18. Referirse a los datos del problema 2-17. £Los datos apoyan la afirmacibn de que la temperatura promedio de 
deflexibn bajo carga de la formulacibn 1 excede la de la formulacibn 2 en al menos 3°F? 

2-19. En la fabricacibn de semiconductor es es comun el uso del grab ado quimico humedo para eliminar el silicio 
de la parte posterior de las obleas antes de la metalizacibn. La rapidez del grabado es una caracteristica im- 
portante de este proceso. Se estdn evaluando dos soluciones de grabado diferentes. Se grabaron ocho obleas 
seleccionadas al azar en cada solucibn, y las cifras de la rapidez del grabado observada (en milbsimas de pul- 
gada/min) se muestran abajo 


Solucibn 1 

Solucibn \ 

l 

9.9 

10.6 

10.2 

10.6 

9.4 

10.3 

10.0 

10.2 

10.0 

9.3 

10.7 

10.4 

10.3 

9.8 

10.5 

10.3 


a) £Los datos indican que la afirmacibn de que ambas soluciones tienen la misma rapidez de grabado pro- 
medio es verdadera? Utilizar a — 0.05 y suponer la igualdad de las varianzas. 

b) Encontrar un intervalo de confianza de 95 % para la diferencia en la rapidez de grabado promedio. 

c) Usar grdficas de probabilidad normal para investigar la adecuacibn de los supuestos de normalidad e 
igualdad de las varianzas. 

2-20. Se estSn comparando dos populares analgbsicos con base en la rapidez de absorcibn del cuerpo. Especifica- 
mente, se afirma que la tableta 1 se absorbe con el doble de rapidez que la tableta 2. Suponer que of y a\ se 
conocen. Desarrollar un estadistico de prueba para 

H q : 2^ =p 2 

2-21. Suponga que se est£ probando 

Hvth * Vi 

donde al y o\ se conocen. Los recursos para hacer el muestreo son limitados, por lo que n x + n 2 = N. ^Cbrno 
deberdn asignarse las N observaciones entre las dos poblaciones para obtener la prueba con la potencia mds 
alta? 

2-22. Desarrollar la ecuacibn 2-46 para un intervalo de confianza de 100(1 — &) por ciento para la varianza de una 
distribucibn normal. 


2-7 PROBLEMAS 59 

2-23, Desarrollar la ecuackm 2-50 para un intervalo de confianza de 100(1 - a) por ciento para el cociente of / o\, 
donde a\ y a\ son las varianzas de dos distribuciones normales. 

2-24. Desarrollar una ecuacidn para encontrar un intervalo de confianza de 100(1 - a) por ciento para la diferen- 
cia en las raedias de dos distribuciones normales donde a\ * a\. Aplicar la ecuacidn desarrollada a los datos 
del experimento del ceraento portland, y encontrar un intervalo de confianza de 95%. 

2-25. Construir un conjunto de datos para los que el estadlstico de prueba t pareada sea muy grande, pero para el 
cual el estadistico de prueba t de dos muestras o combinada usual sea pequeno. En general, describir c<3mo se 
crearon los datos. LLe da esto al lector alguna idea respecto de c6mo funciona la prueba t pareada? 



Experimented con un solo 
factor: el analisis de varianza 


F.n el capftulo 2 se analizaron los metodos para comparar dos condiciones o tratamientos. Por ejemplo, el 
experimento de la fuerza de la tension de adhesion del cemento portland incluyo dos formulaciones dife- 
rentes del mortero. Otra forma de describir este experimento es como un experimento con un solo factor, 
con dos niveles del factor, donde el factor es la formulacidn del mortero y los dos niveles son los dos mdto- 
dos diferentes para hacer la formulation. Muchos experimentos de este tipo involucran mas de dos nive- 
les del factor. En este capftulo se presentan los metodos para el diseno y el an&lisis de los experimentos 
con un solo factor con a niveles del mismo (o a tratamientos). Se supondra que el experimento se ha alea- 
torizado completamente. 


34 UN EJEMPLO 

Un ingeniero de desarrollo de productos tiene interns en investigar la resistencia a la tensidn de una fibra 
sint6tica nueva que se usara para hacer tela de camisas para caballero. El ingeniero sabe por experienda 
previa que la resistencia a la tension se afecta por el peso porcentual del algodon utilizado en la mezcla de 
materiales de la fibra. Ademas, sospecha que al aumentar el contenido de algoddn se incrementar^ la re- 
sistencia, al menos en un prindpio. Sabe asimismo que el contenido de algodon debera variar entre 10 y 
40 por ciento para que el producto final tenga otras caracteristicas de calidad que se desean (como la 
capacidad de ser sometido a un tratamiento de planchado permanente). El ingeniero decide probar ejem- 
plares en cinco niveles del peso porcentual del algodon: 15, 20, 25, 30 y 35 por ciento. Tambien decide pro- 
bar cinco ejemplares en cada nivel del contenido de algoddn. 

Se trata de un ejemplo de un experimento con un solo factor con a = 5 niveles del factor y n = 5 repli- 
cas. Las 25 corridas deber£n realizarse de manera aleatoria. Para ilustrar como puede aleatorizarse el or- 
den de las corridas, suponga que las corridas se numeran de la siguiente manera: 


60 
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Peso 

porcentual 

del algoddn Numero de corrida experimental 


15 

1 

2 

3 

4 

5 

20 

6 

7 

8 

9 

10 

25 

11 

12 

13 

14 

15 

30 

16 

17 

18 

19 

20 

35 

21 

22 

23 

24 

25 


Ahora se selecciona un numero aleatorio entre 1 y 25. Suponga que este numero es 8. Entonces la obser- 
vacidn numero 8 (20% de algoddn) se corre primero. Este proceso se repetiria hasta que las 25 observa- 
ciones tengan asignada una position en la secuencia de prueba. 1 Muchos paquetes de software de 
computadora para ayudar a los experimentadores a seleccionar y construir un diseno, aleatorizan el or- 
den de las corridas utilizando numeros aleatorios de esta manera. 

Suponga que la secuencia de prueba obtenida es 


Secuencia de prueba 

Numero de corrida 

Peso porcentual del algodOn 

1 

8 

20 

2 

18 

30 

3 

10 

20 

4 

23 

35 

5 

17 

30 

6 

5 

15 

7 

14 

25 

8 

6 

20 

9 

15 

25 

10 

20 

30 

11 

9 

20 

12 

4 

15 

13 

12 

25 

14 

7 

20 

15 

1 

15 

16 

24 

35 

17 

21 

35 

18 

11 

25 

19 

2 

15 

20 

13 

25 

21 

22 

35 

22 

16 

30 

23 

25 

35 

24 

19 

30 

25 

3 

15 


Esta secuencia de prueba aleatorizada es necesaria para evitar que los efectos de variables perturbadoras 
desconocidas — las cuales quiza varien fuera de control durante el experimento — contaminen los resulta- 
dos. Para ilustrar esto, suponga que las 25 corridas de prueba tuvieran que realizarse en el orden original 
no aleatorizado (es decir, primero se prueban los cinco ejemplares con 15% de algodon, despuds se prue- 


1 La unica restriction sobre la aleatorizatiOn en este caso, es que si se saca de nuevo el mismo numero (es decir, 8), se descarta. Se tra- 
ta de una restriction secundaria y se ignora. 
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Tabla 3-1 Datos (en lb/pulgada z ) del experimento de la resistencia a la tensidn 


Peso porcentual 
del algodbn 


Observaciones 


Total 

Promedio 

1 

2 

3 

4 

5 

15 

7 

7 

15 

11 

9 

49 

9.8 

20 

12 

17 

12 

18 

18 

77 

15.4 

25 

14 

18 

18 

19 

19 

88 

17.6 

30 

19 

25 

22 

19 

23 

108 

21.6 

35 

7 

10 

11 

15 

11 

54 

10.8 







376 

15.04 


ban los cinco ejemplares con 20% de algodbn, etc.). Si la m&quina empleada para probar la resistencia a la 
tension presenta un efecto de calentamiento tal que entre mis tiempo est6 funcionando sean menores las 
lecturas de la resistencia a la tension observadas, el efecto del calentamiento contaminari potencialmen- 
te los datos de la resistencia a la tension y destruira la validez del experimento. 

Suponga que el ingeniero corre la prueba en el orden aleatorio que se ha determinado. En la tabla 3-1 
se muestran las observaciones que obtiene para la resistencia a la tensibn. 

Siempre es una buena idea examinar grificamente los datos experimentales. En la figura 3-1 se mues- 
tran los diagramas de caja para la resistencia a la tension con cada nivel del peso porcentual de algodbn, y 
en la figura 3-2 se ilustra un diagrama de dispersidn de la resistencia a la tension contra el peso porcen- 
tual del algodbn. En la figura 3-2, los puntos rellenos son las observaciones individuates y los circulos hue- 
cos son los promedios de la resistencia a la tensibn observada. Ambas grificas indican que la resistencia a 
la tension se incrementa cuando el contenido de algodbn se incrementa, hasta cerca de 30% de algodbn. 
Despuds de 30% de algodon, hay un marcado descenso de la resistencia a la tension. No hay evidencia so- 
lida que sugiera que la variabilidad de la resistencia a la tensibn alrededor del promedio dependa del peso 
porcentual del algodon. Con base en este analisis grafico simple, se tienen firmes sospechas de que 1) el 
contenido de algodbn afecta la resistencia a la tension y 2) alrededor de 30% de algodon produce la resis- 
tencia maxi m a. 

Suponga que se quiere ser m&s objetivo en el analisis de los datos. Especificamente, imagine que 
quieren probarse las diferencias entre las resistencias a la tension promedio con todos los niveles a = 5 del 



Figura 3-1 Diagramas de caja de la resistencia a la tension 
contra el peso porcentual del algoddn. 
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E1gura3-2 Diagrams de dispersidn dc la resistencia 
a la tensi6n contra el peso porcentual del algoddn. 


peso porcentual del algoddn. Por lo tanto, el interns se centra en probar la igualdad de las cinco medias. Pu- 
diera parecer que este problema se resolverla realizando una prueba t para todos los pares de medias 
posibles. Sin embargo, no es esta la mejor solucidn de este problema, porque llevarfa a una distorsidn con- 
siderable en el error tipo I. Por ejemplo, suponga que quiere probarse la igualdad de las cinco medias 
usando comparaciones por pares. Hay 10 pares posibles, y si la probabilidad de aceptar correctamente la 
hip6tesis nula en cada prueba individual es de 1 - a = 0.95, la probabilidad de aceptar correctamente la 
hipdtesis nula en las 10 pruebas es de (0.95) 10 = 0.60 si las pruebas son independientes. Por lo tanto, ha 
ocurrido un incremento sustancial en el error tipo I. 

El procedimiento correcto para probar la igualdad de varias medias es el anilisis de varianza. Sin 
embargo, el analisis de varianza tiene un rango de aplicaciones mucho mis amplio que el problema ante- 
rior. Probablemente sea la tecnica mis util en el campo de la inferencia estadistica. 


3-2 EL ANALISIS DE VARIANZA 

Suponga que se tienen a tratamientos o niveles diferentes de un solo factor que quieren compararse. La 
respuesta observada de cada uno de los a tratamientos es una variable aleatoria. Los datos aparecerian 
como en la tabla 3-2. Una entrada de la tabla 3-2 (por ejemplo, y v ) representa la observacidn y'-esima to- 


Tabla 3-2 Datos tfpicos de un experimento de un solo factor 


Ttatamiento 

(nivel) 


Observaciones 


Ibtales 

Promedios 

i 

yn 

yu 

... 

yin 

>1. 

K 

2 

yn 

yzz 


y2n 

3k 

?2. 

a 

y a i 

y a 2 


yon 

y± 







y.. 

y. 


64 CAPfTULO 3 EXPERIMENTOS CON UN SOLO FACTOR; EL ANALISIS DE VARIANZA 


mada bajo el nivel del factor o tratamiento i. Habra, en general, n observaciones bajo el tratamiento i'-6si- 
mo. Observe que la tabla 3-2 es el caso general de los datos del experimento de la resistencia a la tensidn 
de la tabla 3-1. 


Modelos para los datos 

Se encontrara util describir las observaciones de un experimento con un modelo. Una manera de escribir 
este modelo es 


y 9 “jMi+s# 


i — 1. 2,-., a 
y = l, 2,..., n 


(3-1) 


donde y, ( es la observation y-dsima,/!, es la media del nivel del factor o tratamiento ;'-6simo, y t tj es un com- 
ponente del error aleatorio que incorpora todas las dem&s fuentes de variabilidad del experimento, inclu- 
yendo las mediciones, la variabilidad que surge de factores no controlados, las diferencias entre las 
unidades experimentales (como los materiales de prueba, etc.) a las que se aplican los tratamientos, y el 
ruido de fondo general en el proceso (ya sean la variabilidad con el tiempo, los efectos de variables am- 
bientales, etc.). Es conveniente considerar que los errores tienen media cero, de tal modo que E(y v ) = fi ( . 

A la ecuacidn 3-1 se le llama el modelo de las medias. Una forma altemativa de escribir un modelo de 
los datos es definiendo 


p t = n+x t , i = 1, 2, .... a 


de tal modo que la ecuacidn 3-1 se convierte en 


ya 


= H + T i +£ il 


*■ = 1,2,..., a 
; = 1 , 2 ,..., n 


(3-2) 


En esta forma del modelo, n es un par&metro comun a todos los tratamientos al que se llama la media glo- 
bal, y r, es un par£metro unico del tratamiento i-esimo al que se le llama el efecto del tratamiento i-esimo. 
A la ecuacion 3-2 se le llama por lo general el modelo de los efectos. 

T&nto el modelo de las medias como el de los efectos son modelos estadisticos lineales; es decir, la va- 
riable de respuestay, y es una funcidn lineal de los par&metros del modelo. Aun cuando ambas formas del 
modelo son utiles, el modelo de los efectos se encuentra con mayor frecuencia en la literatura del diseno 
experimental. Tiene cierto atractivo intuitivo por cuanto /< es una constante y los efectos de los tratamien- 
tos t, representan desviaciones de esta constante cuando se aplican los tratamientos especificos. 

A la ecuacidn 3-2 (o a la 3-1) se le llama tambi6n el modelo del an&lisis de varianza simple o de un 
solo factor (o direccidn), porque unicamente se investiga un factor. Ademas, sera un requisito que el ex- 
perimento se lleve a cabo en orden aleatorio para que el ambiente en el que se apliquen los tratamientos 
(llamados con frecuencia unidades experimentales) sea lo mas uniforme posible. Por lo tanto, el diseno 
experimental es un diseno completamente aleatorizado. Los objetivos seran probar las hipdtesis apropia- 
das acerca de las medias de los tratamientos y estimarlas. Para probar las hipdtesis, se supone que los 
errores del modelo son variables aleatorias que siguen una distribucidn normal e independiente con me- 
dia cero y varianza a 2 . Se supone asimismo que la varianza if es constante para todos los niveles del factor. 
Esto implica que las observaciones 

y tj ~N(fi+T n o 2 ) 

y que las observaciones son mutuamente independientes. 
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^Factor fijo o aleatorio? 

El modelo estadfstico (ecuacidn 3-2) describe dos situaciones diferentes con respecto a los efectos de los 
tratamientos. Primera, los a tratamientos pudieron ser elegidos expresamente por el experimentador. En 
esta situacidn quieren probarse hipdtesis acerca de las medias de los tratamientos, y las conclusiones se 
aplicar£n unicamente a los niveles del factor considerados en el an&lisis. Las conclusiones no pueden ex- 
tenderse a tratamientos similares que no fueron considerados explfcitamente. Tkmbi6n se podria querer 
estimar los pariimetros del modelo (ji, r £ , o 2 ). A este se le llama el modelo con efectos fyos. De manera al- 
temativa, los a tratamientos podrian ser una muestra aleatoria de una poblacidn m&s grande de trata- 
mientos. En esta situacidn seria deseable poder extender las conclusiones (las cuales se basan en la 
muestra de los tratamientos) a la totalidad de los tratamientos de la poblaci6n, sea que se hayan conside- 
rado explicitamente en el analisis o no. Aqui las r, son variables aleatorias, y el conocimiento de las r, par- 
ticulares que se investigaron es relativamente inutil. M<ls bien, se prueban hipotesis acerca de la 
variabilidad de las r, y se intenta estimar su variabilidad. A este se le llama el modelo con efectos aleatorios 
o modelo de los componentes de la varianza. La revision de experimentos con factores aleatorios se pos- 
pondra hasta el capitulo 12. 


3-3 ANALISIS DEL MODELO CON EFECTOS FIJOS 


En esta secciOn se desarrolla el analisis de varianza de un solo factor para el modelo con efectos fijos. Re- 
cuerde quey £ representa el total de las observaciones bajo el tratamiento t-Osimo. Sea quey £ . represente el 
promedio de las observaciones bajo el tratamiento i-Osimo. De manera similar, sea que y represente el 
gran total de todas las observaciones y que y represente el gran promedio de todas las observaciones. 
Expresado simbOlicamente, 


n 

y t = 2 >V> In ' = 1. 2, ..., a 

1=1 (3-3) 

y = 22 y* y.. = yJ N 

/-i y=i 


donde N = an es el numero total de observaciones. Se nota que el subfndice “punto” implica la operacidn 
suma sobre el submdice que reemplaza. 

El inter6s se encuentra en probar la igualdad de las a medias de los tratamientos; es decir, E(y i} ) = /* + 
r, = ft it i = 1, 2, a. Las hipdtesis apropiadas son 

= = ... = n a 

fi- para al menos un par (/, j) 


En el modelo de los efectos, la media del tratamiento z-dsimo se descompone en dos componentes tales 
que = ji + Ti> Por lo general, p se considera como una media global, de tal modo que 



a 


2 L = 0 

1-1 


Esta definition implica que 
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Es decir, los efectos del tratamiento o factor pueden considerarse como desviaciones de la media global. 2 
Por consiguiente, una forma equivalente de escribir las hipdtesis anteriores es en terminos de los efectos 
de los tratamientos r„ por ejemplo 

H 0 :r l = r 2 = ... x a = 0 
H 1 :r i * 0 para al menos una i 

Por lo tanto, se habla de probar la igualdad de las medias de los tratamientos o de probar que los efectos 
de los tratamientos (las r ,) son cero. El procedimiento apropiado para probar la igualdad de las medias de 
los a tratamientos es el analisis de varianza. 


3-3.1 Descomposici6n de la suma de cuadrados total 

El nombre analisis de varianza se deriva de la particidn de la variabilidad total en sus partes componen- 
tes. La suma de cuadrados total corregida 

ss r = t iov-Jt ) 1 

i - 1 I - 1 


se usa como una medida de la variabilidad global de los datos. Intuitivamente, esto es razonable porque, 
si SS T tuviera que dividirse por el ndmero apropiado de grados de libertad (en este caso, an - 1 = N- 1), se 
obtendria la varianza muestral de lasy. La varianza muestral es, desde luego, una medida est&ndar de va- 
riabilidad. 

Observe que la suma de cuadrados total corregida SS T se puede escribir como 


XX (x# - x. ) 2 = 2 X kx. - x. )+(x* - x, )f 


(3-4) 


«■- 1 ;=i 


1 i- 1 


X X (Xff - x. y = «x (x, - x. y + X X (x* - x,-. ) 2 

i=l t=l ;“1 

+ 2XX (Xi. - X. Xx# - X. ) 


1=1 j=l 


i = 1 7=1 


Sin embargo, el t^rmino del producto cruzado de la ecuacion 3-5 es cero, ya que 

n 

X (Xtf - X. ) = X, - «X, = Xi. - «(Xi. / n) = 0 


J - 1 


Se tiene, por lo tanto, 


XS (X»“X..) 2 =«X (Xi.-X,) 2 +XX (X(i — X/. ) 2 


1=1 7=1 


1-1 7-1 


(3-5) 


(3-6) 


La ecuacidn 3-6 establece que puede hacerse la particibn de la variabilidad total de los datos, medida por 
la suma de cuadrados total corregida, en una suma de cuadrados de las diferencias entre los promedios de 
los tratamientos y el gran promedio, mis una suma de cuadrados de las diferencias de las observaciones 
dentro de los tratamietitos y el promedio de los tratamientos. Entonces, la diferencia entre los promedios 


2 Para m£s infonnaci6n sobre este tema, referirse al material suplementario del texto del capftulo 3. 
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de los tratamientos observados y el gran promedio es una medida de las diferencias entre las medias de 
los tratamientos, mientras que las diferencias de las observaciones dentro de un tratamiento y el prome- 
dio del tratamiento, pueden deberse unicamente al error aleatorio. Por lo tanto, la ecuacidn 3-6 puede es- 
cribirse simbolicamente como 


SS T — 55 Tratamientos +SS E 

donde a SS^ Ri!iniicntos se le llama la suma de cuadrados debida a los tratamientos (es decir, entre los trata- 
mientos), y a SS E se le llama la suma de cuadrados debida al error (es decir, dentro de los tratamientos). 
Hay an = N observaciones en total; por lo tanto, SS T tiene N - 1 grados de libertad. Hay a niveles del fac- 
tor (y medias de a tratamientos), de donde SS^ X9jn ^ nt0i tiene a -l grados de libertad. Por ultimo, dentro de 
cualquier tratamiento hay n rdplicas que proporcionan n - 1 grados de libertad con los cuales estimar el 
error experimental. Puesto que hay a tratamientos, se tienen a(n -l) = an-a=N-a grados de libertad 
para el error, 

Es util examinar explicitamente los dos tdrminos del lado derecho de la identidad fundamental del 
an&lisis de varianza (ecuacidn 3-6). Considere la suma de cuadrados del error 

ss e = 22 (y* - x. ) 2 = 2 2 (x, ~ x. ) 2 

f=l j=x i- 1 lj=i 


En esta forma es f£cil ver que el t6rmino entre corchetes, si se divide por n- 1, es la varianza muestral del 
tratamiento i-6 simo, o 

2 (x - x. y 

Sf — — t i = l, 2, a 

n~ 1 


Ahora pueden combinarse a varianzas muestrales para obtener una sola estimacion de la varianza pobla- 
cional comtin de la siguiente manera: 


(n~l)Si +(ra-l)S 2 2 + ... + (»- 1)5* 
(n— l)+(n— 1) + ... + (n — 1) 


a 

1 

i= 1 

2 (y f -y t ) 2 

.7=1 


1 (»-D 

;=1 

SS E 

(N 

-a) 


Por lo tanto, SS E /(N~a ) es una estimaci6n combinada de la varianza comun dentro de cada uno de los a 
tratamientos. 

De manera similar, si no hubiera diferencias entre las medias de los a tratamientos, podria usarse la 
variacidn de los promedios de los tratamientos y el gran promedio para estimar o 2 . Especificamente 


SS 


Tratamientos 


a - 1 



(X.-X ) 2 

a — 1 


es una estimacidn de a 2 si las medias de los tratamientos son iguales. La razdn de esto puede verse de ma- 
nera intuitiva de la siguiente manera. La cantidad 2 * =1 ( y L -y,) 1 ! (a - 1) estima a 2 /^, la varianza de los pro- 
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medios de los tratamientos, de donde hZ* st (y L -y.) 2 /(a - 1) debe estimar cr 2 si no hay diferencias en las 
medias de los tratamientos. 

Se observa que la identidad del an&lisis de varianza (ecuacidn 3-6) nos proporciona dos estimaciones 
de a 2 : una basada en la variabilidad inherente dentro de los tratamientos y una basada en la variabilidad 
entre los tratamientos. Si no hay diferencias en las medias de los tratamientos, estas dos estimaciones de- 
beran ser muy similares, y si no lo son, se sospecha que la diferencia observada puede ser causada por di- 
ferencias en las medias de los tratamientos. Aun cuando se ha usado un razonamiento intuitivo para 
desarrollar este resultado, puede adoptarse un enfoque un tanto m£s formal, 

A las cantidades 


MS 


Tratamientos 


ss 


Tratamientos 


a - 1 


ms k = - 


ss e 

N-a 


se les llama cuadrados medios. Se examinaran ahora los valores esperados de estos cuadrados medios. 
Considere 


<*-*>*_ 

SS +y, 2 ) 


N-a 

1 

N-a 

1 

N-a 


L‘=i i 

a n 


SS 3$-2»S yf. +n S yl 

i=l /— 1 i= 1 i=l 

a n i a 


n 

i= 1 j = 1 i- 1 


A1 sustituir el modelo (ecuacion 3-1) en esta ecuacion se obtiene 


E(MS e ) = 


N-a 


SS (^ +T i +£ a ) 2 S S ^ +r . +£ 


i“ 1 J- 1 


n r= i \j . i 


Entonces, al elevar al cuadrado y tomar el valor esperado de la cantidad entre corchetes, se observa que 
los terminus que incluyen a el y e 2 son reemplazados por o 2 y no 2 , respectivamente, debido a que E(e i) ) = 
0. Ademis, todos los productos cruzados que incluyen a £ tj tienen valor esperado cero. Por lo tanto, des- 
pues de elevar al cuadrado y tomar el valor esperado, la ultima ecuacidn se convierte en 


E{MS e ) = 


N-a 


N/i 2 t 2 + No 2 — N/u 2 — rf-aa 2 


i=l 


E(MS e ) = a 2 


o 
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Aplicando un enfoque similar puede demostrarse tambi6n que 3 

n± t? 

E(MS T „_) = o 2 +^- r 

Por lo tanto, como se argumentd heuristicamente, MS E = SS E /(N-a ) estima a 2 y, si no hay diferencias en 
las medias de los tratamientos (lo cual implica que r, = 0), M5 Xratainicnlos = 55 Xratamieni0S /(a - 1) tambi6n esti- 
ma a 2 . Sin embargo, observe que si las medias de los tratamientos difieren, el valor esperado del cuadrado 
medio de los tratamientos es mayor que cr 2 . 

Parece claro que es posible realizar una prueba de la hipotesis de que no hay diferencias en las medias 
de los tratamientos comparando A/.S’.,j. 1IalIllcnIOS y MS E . Se considera ahora c6mo puede hacerse esta compa- 
racidn. 


3-3.2 Andlisis estadistico 

Se investiga ahora c6mo puede llevarse a cabo una prueba formal de la hipotesis de que no hay diferen- 
cias en las medias de los tratamientos =/t 2 = ■ ■ ■ = /t a , o de manera equivalente, H 0 :r 1 = x 2 = - • -x a = 
0). Puesto que se ha supuesto que los errores t',, siguen una distribucidn normal e independiente con me- 
dia cero y varianza o 2 , las observacionesy,j tienen una distribucidn normal e independiente con media pi + 
Tj y varianza a 2 . Por lo tanto, SS T es una suma de cuadrados de variables aleatorias con una distribucidn 
normal; por consiguiente, puede demostrarse que SSjja 2 tiene una distribucion ji-cuadrada con A - 1 gra- 
dos de libertad. Ademas, puede demostrarse que SSJcr es una variable ji-cuadrada con A- a grados de li- 
bertad y que es una variable ji-cuadrada con a - 1 grados de libertad si la hipotesis nula H 0 : r, 

= 0 es verdadera. Sin embargo, las tres sumas de cuadrados no son necesariamente independientes, ya 
que la suma de y SS E es SS V El siguiente teorema, que es una forma especial de un teorema 

atribuido a William Cochran, es util para establecer la independencia de SS E y 55 IralamlcnI0S . 


TEOREMA 3-1 

Teorema de Cochran 

Sea Z, igual a NID(0, 1) para i = 1, 2, v y 

2 z 2 = q 1+ q 2 + ... + q, 

i~ 1 

donde s < v, y Q, tiene v, grados de libertad (t = 1, 2, s). Entonces Q u Q 2 , ..., Q s son variables aleatorias 
ji-cuadrada independientes con v lt .... v s grados de libertad, respectivamente, si y s61o si 

V=Vi+V 2 + ...+ v , 


Puesto que los grados de libertad de S5 Watamientos y SS E suman N- 1, el numero total de grados de liber- 
tad, el teorema de Cochran implica que 55 ltatamientos /a 2 y SS^/o 2 son variables aleatorias ji-cuadrada con 


3 Referirse al material suplementario del texto del capftulo 3. 
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Tabla 3-3 Tabla de anilisis de varianza para el modelo con un solo factor y efectos fijos 


Fuente de variacidn 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

F o 

Entre los tratamientos 

a 

‘^‘^Tratamicntofl — ^ i . X. ) 

a- 1 

^^TVatamientOB 

MS 

Tratamientos 

0 MS e 

Error (dentro de los 
tratamientos) 

i=l 

SS E = SS T - £*S Tratamient08 

N-a 

ms e 


Tbtal 

ss t C y «~ y ..) 2 

»-i i 

N-l 




una distribucidn independiente. Por lo tanto, si la hipotesis nula de que no hay diferencias en las medias 
de los tratamientos es verdadera, el cociente 

p _ ‘^Tratantiemos f _ *** _ ^^TrataniientOB s, 

0 SS E /(N-a ) MS e 1 ' ’ 


se distribuye como F con a -lyN~a grados de libertad. La ecuacidn 3-7 es el estadistico de prueba para 
la hipotesis de que no hay diferencias en las medias de los tratamientos. 

Por los cuadrados medios esperados se observa que, en general, MS E es un estimador insesgado de o 2 . 
Asimismo, bajo la hipdtesis nula, MSn. atamientos es un estimador insesgado de o 2 . Sin embargo, si la hipdtesis 
nula es falsa, el valor esperado de es mayor que a 2 . Por lo tanto, bajo la hipotesis alternativa, el 

valor esperado del numerador del estadistico de prueba (ecuacidn 3-7) es mayor que el valor esperado del 
denominador, y H 0 deberd rechazarse para valores del estadistico de prueba que son muy grandes. Esto 
implica una regidn critica de una sola cola superior. Por lo tanto, H 0 deberA rechazarse y concluirse que 
hay diferencias en las medias de los tratamientos si 


Fa > 

donde F 0 se calcula con la ecuacidn 3-7. De manera alternativa, podria usarse el enfoque del valor P para 
tomar una decision. 

Es posible obtener f6rmulas para calcular estas sumas de cuadrados reescribiendo y simplificando las 
definiciones de SA Xratamienlos y SS, en la ecuacidn 3-6. Se obtiene asi 


a n 


*= 1 ;=1 



(3-8) 


SS, 


1 a «,2 

= ~y y 2 -*- 

nti '■ N 


(3-9) 


La suma de cuadrados del error se obtiene por sustraccion como 

SS E = SS T — SS JaaajaatB (3-10) 

El procedimiento de prueba se resume en la tabla 3-3. Se le conoce como tabla del an&lisis de varianza. 


EJEMPLO 3-1 

El experimento de la resistencia a la tension 

Para ilustrar el analisis de varianza, se retoma al ejemplo que empezd a comentarse en la seccidn 3-1. Re- 
cuerde que al ingeniero de desarrollo de productos le interesa determinar si el peso porcentual del algo- 
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d6n en una fibra sint6tica afecta la resistencia a la tensidn, y ha Uevado a cabo un experimento 
completamente aleatorizado con cinco niveles del peso porcentual del algoddn y cinco replicas. Por con- 
veniencia, a continuacion se repiten los datos de la tabla 3-1: 


Peso 

porcentual 
del algoddn 


Resistencia a la tension observada 
(lb/pulg 2 ) 


Tbtales 

Promedios 

1 

2 

3 

4 

5 

x 

X. 

15 

7 

7 

15 

11 

9 

49 

9.8 

20 

12 

17 

12 

18 

18 

77 

15.4 

25 

14 

18 

18 

19 

19 

88 

17.6 

30 

19 

25 

22 

19 

23 

108 

21,6 

35 

7 

10 

11 

15 

11 

54 

X. “ 376 

10.8 

X = 15.04 


Se usari el an&lisis de varianza para probar = fi 2 = Fi = Fa = Fs contra la hipdtesis altemativa 
if^algunas medias son diferentes. Las sumas de cuadrados requeridas se calculan como sigue: 


5 5 




-1 /=i 


- (7) 2 +(7) 2 +(15) + ■■■ +(15) +(ll) z - 


2 (376) 2 


25 


= 636.96 


SS T 


= ly y 2_yL 

« ^ y ‘- N 


= |[(49) 2 + -. +(54) 2 ]-^^-= 475.76 

SS E = SS T - SS Tnamjeril(X 

* 636.96— 475.76 « 161.20 


Generalmente estos calculos se realizarlan en una computadora, utilizando paquetes de software con la 
capacidad de analizar datos de experimentos disenados. 

En la tabla 3-4 se resume el an&lisis de varianza. Observe que el cuadrado medio entre los tratamien- 
tos (118.94) es varias veces mayor que el cuadrado medio dentro de los tratamientos o cuadrado medio 
del error (8.06). Esto indica que no es posible que las medias de los tratamientos sean iguales. En tirmi- 
nos mis formales, puede calculate el cociente F, F 0 = 118.94/8.06 = 14.76, y comparar este valor con un 
punto porcentual apropiado de la cola superior de la distribucidn M . Suponga que el experimentador 
ha seleccionado a = 0.05. En la tabla IV del apindice se encuentra que F 005> 4| w = 2.87. Puesto que F 0 = 
14.76 > 2.87, se rechaza/f 0 y se concluye que las medias de los tratamientos difieren; es decir, el peso por- 
centual del algoddn en la fibra afecta de manera significativa la resistencia a la tensi6n media. Tambi6n 


Tabla 3-4 AnSlisis de varianza de los datos de la resistencia a la tensidn 


Fuente de variacidn 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

F 0 

Valor P 

Peso porcentual del algoddn 

475.76 

4 

118.94 

F 0 = 14.76 

<0.01 

Error 


20 

8.06 



Tbtal 

636.96 

24 
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Figura 3-3 La distribuci6n de referenda (F 4 2 o) P ara e l estadistico de 
pmeba F 0 en el ejemplo 3-1. 


podria calcularse un valor P para este estadistico de prueba. En la figura 3-3 se muestra la distribution de 
referencia (F 4 20 ) para el estadistico de prueba F 0 . Evidentemente, el valor P es muy pequeno en este caso. 
Puesto que Eo. 01 , 4,20 = 4.43 y F 0 > 4.43, puede concluirse que un limite superior del valor P es 0.01; es detir, 
P < 0.01 (el valor P exacto es P = 9.11 x 10* 6 ). 


Calculos mammies 

Posiblemente el lector haya notado que la suma de cuadrados se definio en tdrminos de promedios; es de- 
tir, por la ecuacion 3-6, 

a 

SS Tm.m^o , “»2 

1=1 


pero las formulas de calculo se desarrollaron utilizando los totales. Por ejemplo, para calcular SSTt aIam ie,,tos> 
se usaria la ecuacion 3-9: 


SS T 


1 a 

= ~y y 2 — — 

n4i y ‘- N 


La razdn principal de esto es por conveniencia; ademas, los totales y L yy estfin menos sujetos al error de 
redondeo que los promedios y L y y . 

En general, no deberd prestarse demasiada atencion a los calculos, ya que se cuenta con una amplia 
variedad de programas de computadora para realizarlos. Estos programas de computadora son tambien 
utiles para realizar muchos otros analisis asociados con el diseno experimental (como el analisis residual y 
la verificacidn de la adecuacion del modelo). En muchos casos, estos programas tambitii ayudaran al ex- 
perimentador a establecer el diseno. 

Cuando es necesario realizar los calculos manualmente, en ocasiones es util codificar las observacio- 
nes. Esto se ilustra en el ejemplo siguiente. 


EJEMPLO 3-2 

Codification de observations 

Los calculos del an&lisis de varianza pueden hacerse con frecuencia de manera mis precisa o simplificada 
codificando las observations. Por ejemplo, considere los datos de la resistencia a la tension del ejemplo 
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Tabla 3-5 Datos codificados de la resistencia a la tension del ejemplo 3-2 


Peso 

porcentual 
del algoddn 


Observaciones 



Tbtales 

yt 

1 

2 

3 

4 

5 

15 

-8 

-8 

0 

-4 

-6 

-26 

20 

-3 

2 

-3 

3 

3 

2 

25 

-1 

3 

3 

4 

4 

13 

30 

4 

10 

7 

4 

8 

33 

35 

-8 

-5 

-4 

0 

-4 

“21 


3-1. Suponga que se resta 15 de cada observacion. Los datos codificados se muestran en la tabla 3-5. Es 
sencillo verificar que 


ay 


SS T 


SS r =(-8) 2 +(-8) 2 +-+(-4) 2 - 25 
(— 26) 2 +(2) 2 + ••• +(-21) 2 (l) 2 

mientos ^ 2^ 


= 636.96 
= 475.76 


SS E = 161.20 

A1 comparar estas sumas de cuadrados con las que se obtuvieron en el ejemplo 3-1, se observa que al res- 
tar una constante de los datos originales las sumas de cuadrados no se modifican. 

Suponga ahora que cada una de las observaciones del ejemplo 3-1 se multiplica por 2. Es sencillo veri- 
ficar que las sumas de cuadrados de los datos transformados son SS, = 2547.84, SS -*. — ... = 1903.04 y 

SS E = 644.80. Estas sumas de cuadrados parecen diferir considerablemente de las que se obtuvieron en el 
ejemplo 3-1. Sin embargo, si se dividen por 4 (es decir, 2 2 ), los resultados son iddnticos. Por ejemplo, para 
la suma de cuadrados de los tratamientos, 1903.04/4 = 475.76. Asimismo, para los datos codificados, el 
codente F es F = (1903.04/4)/(644.80/20) = 14.76, que es identico al cociente F de los datos originales. 
Por lo tanto, los analisis de varianza son equivalentes. 


Pruebas de aleatorizacion y an&lisis de varianza 

En el desarrollo del analisis de varianza con la prueba F, se ha utilizado el supuesto de que los errores 
aleatorios e v son variables aleatorias que siguen una distribucidn normal e independiente. Tambien es po- 
sible justificar la prueba F como la aproximacidn de una prneba de aleatorizacidn. Para ilustrar esto, su- 
ponga que se tienen cinco observaciones de cada uno de dos tratamientos y que quiere probarse la 
igualdad de las medias de los tratamientos. Los datos aparecerian asf: 

Ttatamiento 1 Ttatamiento 2 



yn 

^12 

yu 

yn 

>23 

yu 

^24 

yis 

yis 


Podria usarse el analisis de varianza con la prueba F para probar H 0 :/i , = fi 2 . De manera altemativa, po- 
dria recurrirse a un enfoque un tanto diferente. Suponga que se consideran todas las formas posibles de 
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asignar los 10 numeros de la muestra anterior a los dos tratamientos* Hay 10!/5!5! = 252 arreglos posibles 
de las 10 observaciones. Si no hay ninguna diferencia en las medias de los tratamientos, los 252 arreglos 
son igualmente posibles* Para cada uno de los 252 arreglos, se calcula el valor del estadistico F usando la 
ecuacidn 3-7* A la distribucidn de estos valores F se le llama distribucitin de aleatorizacidn, y un valor 
grande de F indica que los datos no son consistentes con la hipdtesis = flv Por ejemplo, si el valor de 
F que se observd realmente fue excedido s61o por 5 de los valores de la distribution de aleatorizacidn, esto 
corresponderfa con el rechazo de H 0 :^ 1 = // 2 con un nivel de signification de a = 5/252 = 0,0198 (o 
1.98%), Observe que no es necesario ningun supuesto de normalidad en este enfoque. 

La dificultad con este enfoque es que, incluso en problemas relativamente pequenos, los calculos re- 
queridos hacen inviable la enumeracidn de la distribucidn de aleatorizacidn exacta. Sin embargo, nume- 
rosos estudios han demostrado que la distribucibn F comun de la teoria normal es una buena 
aproximacibn de la distribuci6n de aleatorizacibn exacta. Por lo tanto, incluso sin el supuesto de normali- 
dad, la prueba F puede considerarse como una aproximacion de la prueba de aleatorizacibn. Para mas de- 
talles sobre las pruebas de aleatorizacion en el analisis de varianza, ver Box, Hunter y Hunter [18]. 


3 "3 *3 Estimacibn de los pardmetros del modelo 

Se presentan ahora los estimadores de los par£metros del modelo con un solo factor 

y los intervalos de confianza para las medias de los tratamientos. M£s adelante se demostrard que estima- 
dores razonables de la media global y de los efectos de los tratamientos estdn dados por 

& = y- (3-n) 

t. = y. —y , i = l, 2, a 

Estos estimadores poseen un considerable atractivo intuitivo; observe que la media global se estima con 
el gran promedio de las observaciones y que el efecto de cualquier tratamiento no es sino la diferencia en- 
tre el promedio del tratamiento y el gran promedio. 

Es posible determinar con facilidad una estimacidn del intervalo de confianza de la media del trata- 
miento i-esimo. La media del tratamiento i-6simo es 


fl i =fl + T i 


Un estimador puntual de seria jU i = /i+f, = y L . Ahora bien, si se supone que los errores siguen una dis- 
tribucion normal, caday, es una NID(w„ a 1 In). Por lo tanto, si o 2 fuera conocida, podria usarse la distribu- 
ci6n normal para definir el intervalo de confianza. A1 utilizar MS E como estimador de a 2 , el intervalo de 
confianza se basaria en la distribucidn t. Por lo tanto, un intervalo de confianza de 100(1 - a) por ciento 
para la media u, del tratamiento i-esimo es 


IMS, _ /MS, 

Vi. _ ^ a!2,N-a ]J ” — Mi ~ S, ^^a!2.N~a y ~ 


(3-12) 


Un intervalo de confianza de 100(1 - a) por ciento para la diferencia en las medias de dos tratamientos 
cualesquiera, por ejemplo seria 


rmr _ _ \ms E 


(3-13) 
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EJEMPLO 3-3 

Utilizando los datos del ejemplo 3-1 pueden encontrarse las estimadones de la media global y de los efec- 
tos de los tratamientos como ju = 376/25 = 15.04 y 

f i = y L - y = 9.80-15.04 « -5.24 
i 2 = y 2 - y = 15.40- 15.04 = +0.36 
f 3 = y 3 - y = 17.60- 15.04 = -2.56 
f 4 = y 4 - y = 21.60- 15.04 = +6.56 
r 5 = y s - y = 10.80- 15.04 = -4.24 

Un intervalo de confianza de 95% para la media del tratamiento 4 (30% de algod6n) se calcula con la 
ecuacidn 3-12 como 

[q~qZ [fiOK 

21.60 - 2.086^—^— < /i 4 < 21. 60 +2086 J— 

o 

21.60 - 2.65</* 4 <21.60+265 

Por lo tanto, el intervalo de confianza de 95% deseado es 18.95 < /* 4 < 24.25. 


Intervalos de confianza simultineos 

Las expresiones para los intervalos de confianza dados en las ecuaciones 3-12y 3-13 son intervalos de con- 
fianza uno a la vez. Es decir, el nivel de confianza 1 -a solo se aplica a una estimation particular. Sin em- 
bargo, en muchos problemas, el experimentador tal vez quiera calcular varios intervalos de confianza, 
uno para cada una de varias medias o diferencias entre medias. Si hay interns en r de estos intervalos de 
confianza de 100(1 -a) por ciento, la probabilidad de que los r intervalos sean correctos simultineamen- 
te es al menos 1 - ra. A la probabilidad ra se le llama con frecuencia indice de error en el modo del experi- 
mento o coeficiente de confianza global. El numero de intervalos r no tiene que ser muy grande antes de 
que el conjunto de intervalos de confianza se vuelva relativamente falto de informacidn. Por ejemplo, si 
hay r = 5 intervalos y a = 0.05 (una eleccion tfpica), el nivel de confianza simult&neo para el conjunto de 
los cinco intervalos de confianza es de al menos 0.75, y si r = 10 y a = 0.05, el nivel de confianza simulta- 
neo es de al menos 0.50. 

Un enfoque para asegurarse de que el nivel de confianza simultaneo no sea demasiado pequeho es 
sustituir all con a/(2r) en las ecuaciones 3-12 y 3-13 del intervalo de confianza uno a la vez. A 6ste se le lla- 
ma el mltodo de Bonferroni, y le permite al experimentador construir un conjunto de r intervalos de con- 
fianza simultcineos para las medias de los tratamientos o las diferencias en las medias de los tratamientos 
para los que el nivel de confianza global es de al menos 100(1 - a) por ciento. Cuando r no es muy grande, 
6ste es un m£todo muy atinado que produce intervalos de confianza razonablemente cortos. Para mis in- 
formacidn, referirse al material suplementario del texto del capitulo 3. 


3-3.4 Datos no balanceados 

En algunos experimentos con un solo factor, puede ser diferente el numero de observations que se ha- 
cen dentro de cada tratamiento. Se dice entonces que el diseho es no balanceado. Sigue siendo posible 
aplicar el anilisis de varianza descrito arriba, pero deben hacerse ligeras modificaciones en las fdrmulas 
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de las sumas de cuadrados. Sea que se hagan «, observaciones bajo el tratamiento i (i = 1, 2, 
N = Z" =1 n r Las formulas para calcular manualmente SS T y 55 Tratatnil ,„ tos quedan como 


55. 


a 


=i 1 


a) y que 


(3-14) 


y 


55 


Tratamientos 



yL_y^ 

N 


(3-15) 


No se requieren m&s cambios en el analisis de varianza. 

Hay dos ventajas al elegir un diseflo balanceado. Primera, el estadfstico de prueba es relativamente 
insensible a las desviaciones pequenas del supuesto de la igualdad de las varianzas de los a tratamientos 
cuando los tamanos de las muestras son iguales. No es este el caso cuando los tamanos de las muestras son 
diferentes. Segunda, la potenda de la prueba se maximiza cuando las muestras tienen el mismo tamano. 


3-4 VERIFICACI6N de la adecuaci6n del modelo 


La descomposicion de la variabilidad presente en las observaciones mediante la identidad del analisis de 
varianza (ecuacion 3-6) es una relation puramente algebraica. Sin embargo, el uso de la partition para 
probar formalmente que no hay diferencias en las medias de los tratamientos requiere que se satisfagan 
ciertos supuestos. Especificamente, estos supuestos son que el modelo 


y, = t*+*t + *i 

describe de manera adecuada las observaciones, y que los errores siguen una distribution normal e inde- 
pendiente con media cero y varianza o 2 constante pero desconocida. Si estos supuestos se satisfacen, el 
procedimiento del analisis de varianza es una prueba exacta de la hipOtesis de que no hay diferencias en 
las medias de los tratamientos. 

Sin embargo, es comiin que en la prfictica estos supuestos no se satisfagan exactamente. Por consi- 
guiente, en general no es prudente confiar en el analisis de varianza hasta haber verificado estos supues- 
tos. Las violaciones de los supuestos b&sicos y la adecuacidn del modelo pueden investigarse con facilidad 
mediante el examen de los residuales. El residual de la observation j-esima en el tratamiento i-esimo se 
define como 

e a = Va ~ % O 16 ) 


donde es una estimacidn de la observacidn y tj correspondiente que se obtiene como sigue: 

y,j = fr +i i 

as y..+(y i .-y..) 


(3-17) 


La ecuacion 3-17 da el resultado intuitivamente claro de que la estimation de cualquier observacion en el 
tratamiento i-i simo no es sino el promedio del tratamiento correspondiente. 

El examen de los residuales debera ser una parte automatica de cualquier analisis de varianza. Si el 
modelo es adecuado, los residuales deberan estar sin estructura; es decir, no deberan contener patrones 
obvios. A traves de un estudio de los residuales, pueden descubrirse muchos tipos de inadecuaciones del 
modelo y violaciones de los supuestos subyacentes. En esta section se indica c6mo puede hacerse con fa- 
cilidad la verification de diagnostico del modelo mediante el an&lisis grafico de los residuales y c6mo re- 
solver varias anormalidades que ocurren comunmente. 



3-4 verjficaci6n de la adecuacion del modelo 77 


3-4.1 El supuesto de normalidad 

La verification del supuesto de normalidad podrfa hacerse graficando un histograma de los residuales. Si 
se satisface el supuesto de NID(0, o 2 ) para los errores, esta grafica debera aparecer como una muestra de 
una distribution normal con centro en cero. Desafortunadamente, cuando se trabaja con muestras pe- 
quenas, suelen ocurrir fluctuaciones significativas, por lo que la aparicidn de una desviacidn moderada de 
la normalidad no implica necesariamente una violacidn seria de los supuestos. Las desviaciones marcadas 
de la normalidad son potencialmente serias y requieren analisis adicional. 

Un procedimiento en extrerao util es construir una grafica de probabilidad normal de los residuales. 
Recuerde que en el capltulo 2 se utilizo una gr&fica de probabilidad normal de los datos originates para 
verificar el supuesto de normalidad cuando se usd la prueba t. En el andlisis de varianza, por lo general es 
mds eficaz (y directo) hacer lo mismo con los residuales. Si la distribuci6n fundamental de los errores es 
normal, esta grafica tendra la apariencia de una linea recta. Para visualizar la linea recta, debera prestarse 
mas atencidn a los valores centrales de la gr&fica que a los valores extremos. 

En la tabla 3-6 se muestran los datos originates y los residuales de los datos de la resistencia a la ten- 
sidn del ejemplo 3-1. La grafica de probabilidad normal se muestra en la figura 3-4. La impresion general 
que surge al examinar esta representation es que la distribucion de los errores puede tener un ligero ses- 
go, con la cola derecha siendo mas larga que la izquierda. La tendencia de la grafica de probabilidad nor- 
mal a curvarse hacia abajo ligeramente del lado izquierdo, implica que la cola izquierda de la distribution 
de los errores sea un tanto mas delgada de lo que se anticiparia con una distribution normal; es decir, los 
residuales negativos no son tan grandes (en valor absoluto) como se esperaba. Sin embargo, esta grafica 
no muestra una desviaciOn marcada de la distribution normal. 

En general, las desviaciones moderadas de la normalidad no son motivo de gran preocupaciOn en el 
andlisis de varianza de efectos fijos (recuerde el an&lisis de las pruebas de aleatorizaciOn de la secciOn 3-3.2). 
Una distribuciOn de los errores que tiene colas considerablemente m£s gruesas o delgadas que la distribu- 
tion normal es motivo de mayor preocupaciOn que una distribution sesgada. Puesto que la prueba F sOlo se 
afecta ligeramente, se dice que el analisis de varianza (y los procedimientos relacionados como las compa- 
raciones multiples) es robusto con respecto al supuesto de normalidad. Las desviaciones de la normalidad 
hacen por lo general que tanto el verdadero nivel de signification como la verdadera potencia difieran lige- 
ramente de los valores anuntiados, con la potencia siendo generalmente m£s baja. El modelo de los efectos 
aleatorios que se revisara en el capitulo 12 se afecta en forma mas severa por la no normalidad. 

labia 3-6 Datos y residuales del ejemplo 3-1“ 


porcentual Observations (/) 


del algoddn 


1 


2 


3 


4 


5 

fl 



-2.8 


-2.8 


5.2 


1.2 


—0.8 


15 

7 

(15) 

7 

(19) 

15 

(25)' 

11 

(12) 

9 

(6) 

9.8 



-3.4 


1-6 


-3.4 


2.6 


2.6 


20 

12 

(8) 

17 

(14) 

12 

(i) 

18 

(id 

19 

(3) 

15.4 


1 

-3.6 


0.4 


0.4 


1,4 


1.4 


25 

14 

(18) 

18 

(13) 

18 

(20) 

19 

(7) 

19 

(9) 

17.6 



-2.6 


3.4 


0.4 


-2.6 


1.4 


30 

19 

(22) 

25 

(5) 

22 

(2) 

19 

(24) 

23 

(10) 

21.6 



-3.8 


-0.8 


0.2 


4.2 


0.2 


35 

7 

(17) 

10 

(21) 

11 

(4) 

15 

(16) 

11 

(23) 

10,8 


fl Los residuales se indican en el recuadro de cada celda. Los numeros entre par£ntesis indican el orden en que se recolectaron los datos. 
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Figura 3-4 Gr&fica de probabilidad normal de los residuales del ejemplo 3-1. 


Una anomalia muy comun que suele ponerse de manifiesto en las graficas de probabilidad normal es 
un residual que es mucho m£s grande que cualquier otro. A un residual asi se le llama con frecuencia pun- 
to atipico. La presencia de uno o mas puntos atipicos puede introducir serias distorsiones en el analisis de 
varianza, por lo que cuando se localiza un punto atipico potential, se requiere una investigation atenta. 
En muchas ocasiones, la causa del punto atipico es un error en los c&lculos o un error al codificar o copiar 
los datos. Si no es dsta la causa, las tircunstancias experimentales que rodean esta corrida particular de- 
ben estudiarse con atencidn. Si la respuesta atipica ocurre en un valor particularmente deseable (alta re- 
sistencia, costo bajo, etc.), el punto atipico puede ser m&s informativo que el resto de los datos. Debera 
tenerse cuidado de no rechazar o descartar una observation atipica a menos que se tengan razones no es- 
tadisticas de peso para hacerlo. En el peor de los casos, puede terminarse con dos analisis; uno con el pun- 
to atipico y uno sin el. 

Existen varios procedimientos estadisticos formales para detectar puntos atipicos (por ejemplo, ver 
Barnett y Lewis [8], Johny Prescott [60] y Stefansky [107]). Puede hacerse una verificacidn aproximada de 
los puntos atipicos examinando los residuales estandarizados 




3-4 verificaciCn de la adecuaci6n del modelo 79 

Si los errores e 0 son N(0, a 2 ), los residuales estandarizados deberan ser aproximadamente normales con 
media cero y varianza unitaria. Por lo tanto, cerca de 68% de los residuales estandarizados deberan estar 
incluidos dentro de los limites ±1, cerca de 95% de ellos deberan estar incluidos dentro de ±2 y virtual- 
mente todos ellos deberan estar incluidos dentro de ±3. Un residual mayor que 3 o 4 desviaciones estin- 
dar a partir de cero es un punto atfpico potencial. 

Para los datos de la resistencia a la tension del ejemplo 3-1, la gr&fica de probabilidad normal no pro- 
duce indicio alguno de puntos atipicos. Ademas, el residual estandarizado mayor es 

, - e * 5 ' 2 5 ' 2 1 "7 

13 y[MS^ 06 2.84 

el cual no debera ser motivo de preocupacidn. 

3-4.2 Grafica de los residuales en secuencia en el tiempo 

La graficacidn de los residuales en el orden temporal de la recoleccidn de los datos es util para detectar 
correlaciones entre los residuales. Una tendencia a tener corridas de residuales positivos y negativos indi- 
ca una correlation positiva. Esto implicaria que el supuesto de independencia de los errores ha sido viola- 
do. Se trata de un problema potencialmente serio y cuya solucidn es dificil, por lo que de ser posible es 
importante evitar el problema cuando se colecten los datos. La aleatorizacidn adecuada del experimento 
es un paso importante para conseguir la independencia. 

En ocasiones las habilidades del experimentador (o los sujetos) pueden cambiar conforme el experi- 
mento avanza, o el proceso bajo estudio puede “vagar sin rumbo” o volverse mis erritico. Esto producira 
con frecuencia un cambio en la varianza del error con el tiempo. Esta condicidn suele llevar a una grifica 
de los residuales contra el tiempo que muestra una dispersion mayor en uno de sus extremos que en el 
otro. Una varianza no constante es un problema potencialmente serio. En las secciones 3-4.3 y 3-4.4 se 
abundara sobre el tema. 

En la tabla 3-6 se muestran los residuales y la secuencia en el tiempo de la recoleccion de los datos 
para el experimento de la resistencia a la tension. En la figura 3-5 se presenta una gr&fica de estos residua- 
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Figura 3-5 Grafica de los residuales contra el tiempo. 
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les contra el tiempo. No hay razdn para sospechar cualquier violation de los supuestos de independencia 
o de una varianza constante. 

3-4.3 Grdfica de los residuales contra los valores ajustados 

Si el modelo es correcto y se satisfacen los supuestos, los residuales deberan estar sin estructura; en par- 
ticular, no deber&n estar relacionados con ninguna otra variable, incluyendo la respuesta predicha. Una 
verificacidn simple es graficar los residuales contra los valores ajustados . (Para el modelo de un experi- 
mento con un solo factor, recuerde que y tj = y u el promedio del tratamiento i-6simo.) Esta grafica no de- 
bera mostrar ningun patrdn obvio. En la figura 3-6 se grafican los residuales contra los valores ajustados 
para los datos de la resistenda a la tension del ejemplo 3-1. No es evidente ninguna estructura inusual. 

Un defecto que sale a relucir en ocasiones en esta grafica es una varianza no constante. En ocasiones la 
varianza de las observariones se incrementa cuando la magnitud de la observation se incrementa. Este seria 
el caso si el error o ruido de fondo del experimento fuera un porcentaje constante de la magnitud de la ob- 
servation. (Esto ocurre com unm ente con muchos instrumentos de medicion; el error es un porcentaje de la 
escala de medicidn.) Si este fuera el caso, los residuales se harian mayores conformey,-, se hiciera mas gran- 
de, y la grafica de los residuales contrary se vena como un embudo o un megafono con la boca hacia afuera. 
Una varianza no constante tambidn surge en los casos en que los datos siguen una distribution no normal, 
sesgada, porque en las distribuciones sesgadas la varianza tiende a ser una funcidn de la media. 

Si se viola el supuesto de la homogeneidad de las varianzas, la prueba F sdlo resulta afectada ligera- 
mente en el modelo balanceado (el mismo tamano de la muestra en todos los tratamientos) con efectos fi- 
jos. Sin embargo, en disenos no balanceados o en casos en que una de las varianzas es considerablemente 
m.ls grande que las demas, el problema es mas grave. Especificamente, si los niveles del factor que tienen 
las varianzas mayores corresponden tambien con los tamaiios de las muestras mas pequenos, el indice de 
error tipo I real es mayor que lo previsto (o los intervalos de confianza tienen niveles de confianza reales 
mas bajos que los que fueron especificados). Reciprocamente, si los niveles del factor con las varianzas 
mayores tienen tambien los tamanos de las muestras mayores, los niveles de significacion son mucho me- 
nores que lo anticipado (los niveles de confianza son mils altos), feta es una buena razon para escoger ta- 
manos de las muestras iguales siempre que sea posible. Para los modelos con efectos aleatorios, las 



Figura 3-6 Grdfica de los residuales contra los valores ajustados. 
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varianzas del error diferentes pueden introducir alteraciones significativas en las inferences sobre los 
componentes de la varianza, incluso cuando se usan disehos balanceados. 

El enfoque usual para abordar el problema de una varianza no constante que ocurre por las razones 
expuestas antes consiste en aplicar una transformacidn para estabilizar la varianza para correr despuds 
el an&lisis de varianza en los datos transformados. En este enfoque, debera tenerse presente que las con- 
clusiones del andlisis de varianza se aplican a las poblaciones transformadas. 

Se han dedicado considerables esfuerzos de investigacidn a la seleccidn de una transformacidn ade- 
cuada. Si los experimentadores conocen la distribucidn tedrica de las observaciones, pueden hacer uso de 
esta informacidn para elegir la transformacidn. Por ejemplo, si las observaciones siguen la distribucidn de 
Poisson, se usaria la transformacidn de la raiz cuadrada y~ = Jy~ o y‘ = ^1 + y if . Si los datos siguen la 
distribucidn lognormal, la transformacidn logaritmica y’ = log y # es adecuada. Para datos binomiales ex- 
presados como fracciones, la transformacidn arcsen y* = arcsen^y” es util. Cuando no hay una transfor- 
macidn obvia, el experimentador realizara por lo general la busqueda emplrica de una transformacidn 
que iguale la varianza independientemente del valor de la media. Al final de esta seccidn se ofrecen algu- 
nos consejos al respecto. En los experimentos factoriales, los cuales se introducen en el capitulo 5, otro 
enfoque es seleccionar una transformacidn que minimi ce el cuadrado medio de las interacciones, siendo 
el resultado un experimento cuya interpretacidn es mds sencilla. En el capitulo 14 se revisan con mayor 
detalle los metodos para seleccionar analiticamente la forma de la transformacidn. Las transformaciones 
que se hacen para la desigualdad de la varianza afectan tambien la forma de la distribucidn del error. En 
la mayoria de los casos, la transformacidn hace que la distribucidn del error estd mds cerca de la distribu- 
cidn normal. Para mds detalles sobre las transformaciones, referirse a Bartlett [7], Boxy Cox [15], Dolby 
[38] y Draper y Hunter [39]. 


Pruebas estadisticas para la igualdad de la varianza 

Aun cuando es frecuente el uso de las graficas residuales para diagnosticar la desigualdad de la varianza, 
se han propuesto tambien varias pruebas estadisticas. Estas pruebas pueden considerarse como pruebas 
formales de las hipdtesis 

H a :o\ = a\ - = 

H l : el enunciado anterior no es verdadero para al menos una of 
Un procedimiento muy utilizado es la prueba de Bartlett. El procedimiento incluye el cdlculo de un 
estadistico cuya distribucidn de muestreo estd aproximada muy de cerca por la distribucidn ji-cuadrada 
con a - 1 grados de libertad cuando las a muestras aleatorias son de poblaciones normales independien- 
tes. El estadistico de prueba es 

X\ = 2.3026— (3-19) 

c 

donde 


9 = (lV-«)log 10 S;-2 («, -l)log 10 5/ 
1 ( ‘ i=1 

c =i+t-^-I 2 (n l -i)- , -(^-«r l 

1=1 


3 ( fl_ 1 ) 




N—a 


y 5,. es la varianza muestral de la poblacidn i-dsima. 
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La cantidad q es grande cuando la diferencia entre las varianzas muestrales Sf es considerablemente 
grande, y es igual a cero cuando todas las Sf son iguales. Por lo tanto, H 0 debera rechazarse para los valo- 
res de %\ que sean muy grandes; es decir, se rechaza H 0 s61o cuando 

X 0 ^ X a.a - 1 

donde x\, a -\ es e l punto porcentual a superior de la distribucidn ji-cuadrada con a - 1 grados de libertad. 
Tambien podria usarse el enfoque del valor P para tomar una decision. 

La prueba de Bartlett es muy sensible al supuesto de normalidad. Por consiguiente, cuando la validez 
de este supuesto est& en duda, no debera usarse la prueba de Bartlett. 


EJEMPLO 3-4 

Ya que el supuesto de normalidad no est& en entredicho, la prueba de Bartlett puede aplicarse a los datos 
de la resistencia a la tension del experimento del peso porcentual de algodbn del ejemplo 3-1. Se calculan 
primero las varianzas muestrales de cada tratamiento y se encuentra que Sf = 11.2, =9.8, Sf = 4.3, Sf 
= 6.8 y Sf = 8.2. Entonces 

_ 4(11.2)+4(9.8)+4(4.3)+4(6.8)+4(8.2) _ 

^ n A A 


q= 201og 10 (8.06)-4pog 10 11.2+log l0 9.8+log 10 4.3+log 10 6.8+log 10 8.2]= 0.45 

c = l+-f--— ) = 1.10 

3(4) U 20 


y el estadlstico de prueba es 


Xl = 2.3026^^=0.93 

*° ( 1 . 10 ) 


Puesto que % 1 05 4 = 9.49, no puede rechazarse la hipotesis nula y se concluye que las cinco varianzas son 
iguales. Se trata de la misma conclusidn a la que se lleg6 al analizar la grdfica de los residuales contra los 
valores ajustados. 


Debido a que la prueba de Bartlett es sensible al supuesto de normalidad, puede haber situaciones en 
las que seria util un procedimiento alternative. Anderson y McLean [2] presentan una atinada revision de 
algunas pruebas estadisticas de la igualdad de la varianza. La prueba de Levene modificada (ver Levene 
[72] y Conover, Johnson y Johnson [31]) es un procedimiento muy util que es robusto en cuanto a las des- 
viaciones de la normalidad. Para probar la hipotesis de que las varianzas son iguales en todos los trata- 
mientos, la prueba de Levene modificada utiliza la desviacidn absoluta de las observaciones y s de cada 
tratamiento de la mediana de los tratamientos, por ejemplo y i . Sea que estas desviaciones se denoten por 




17 1, 2, ..., a 
[j = 1) 2, ..., n, 


La prueba de Levene modificada evalua entonces si la media de estas desviaciones es igual o no para to- 
dos los tratamientos. Cuando las desviaciones medias son iguales, las varianzas de las observaciones de 
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Tabla 3-7 Datos de la descarga pico 


Mtiodo de 
estimation 



Observaciones 



ft. 

r, 

s, 

1 

0.34 

0.12 

1.23 

0.70 

1.75 

0.12 

0.71 

0.520 

0.66 

2 

0.91 

2.94 

2.14 

2.36 

2.86 

4.55 

2.63 

2.610 

1.09 

3 

6.31 

8.37 

9.75 

6.09 

9.82 

7.24 

7.93 

7.805 

1.66 

4 

17.15 

11.82 

10.95 

17.20 

14.35 

16.82 

14.72 

15.59 

2.77 

MOtodo de 










estimation 

Desviaciones d tj para la prueba de Levene modificada 




1 

0.18 

0.40 

0.71 

0.18 

1.23 

0.40 




2 

1.70 

0.33 

0.47 

0.25 

0.25 

1.94 




3 

1.495 

0.565 

1.945 

1.715 

2.015 

0.565 




4 

1.56 

3.77 

4.64 

1.61 

1.24 

1.23 





todos los tratamientos ser£n iguales. El estadistico de prueba para la prueba de Levene es simplemente el 
estadistico F ANOVA usual para probar la igualdad de las medias que se aplica a las desviaciones absolutas. 

EJEMPLO 3-5 

Un ingeniero civil est& interesado en determinar si cuatro m6todos diferentes para estimar la frecuencia 
de las inundaciones producen estimaciones equivalentes de la descarga pico cuando se aplican a la misma 
cuenca. Cada procedimiento se usa seis veces en la cuenca, y los datos de las descargas resultantes (en 
pies cubicos por segundo) se muestran en la parte superior de la tabla 3-7. El an&lisis de varianza de los 
datos, el cual se resume en la tabla 3-8, implica que hay una diferencia en las estimaciones de la descarga 
pico promedio obtenidas en los cuatro procedimientos. La gr&fica de los residuales contra los valores 
ajustados, la cual se muestra en la figura 3-7, es preocupante porque la forma de embudo con la boca ha- 
cia afuera indica que no se satisface el supuesto de una varianza constante. 

Se aplicar& la prueba de Levene modificada a los datos de la descarga pico. La parte superior de la ta- 
bla 3-7 contiene las medianas de los tratamientos x y la parte inferior contiene las desviaciones d i} alrede- 
dor de las medianas. La prueba de Levene consiste en realizar un an&lisis de varianza est&ndar en las d 
El estadistico de prueba F que resulta en este caso es F 0 = 4.55, para el cual el valor P es P - 0.0137. Por lo 
tanto, la prueba de Levene rechaza la hipdtesis nula de que las varianzas son iguales, coincidiendo en 
esencia con el diagnbstico que se hizo a partir del examen visual de la figura 3-7. Los datos de la descarga 
pico son un buen candidato para una transformation de datos. 


SelecciOn empirica de una transformation 

Se sehalO ya que si los experimentadores conocieran la relation entre la varianza de las observations y la 
media, podrian usar esta information como guia para la selection de la forma de la transformation. Se 


Tabla 3-8 An£lisis de varianza de los datos de la descarga pico 


Fuente de 
variacidn 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

F o 

Valor P 

Mtiodos 

708.3471 

3 

236.1157 

76.07 

<0.001 

Error 

62.0811 

20 

3.1041 



Tbtal 

770.4282 

23 
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Figura 3-7 Gr&fica de los residuales contra y L para el 
ejemplo 3-5. 


desarrolla ahora este punto y se presenta un mdtodo para seleccionar empfricamente la forma de la trans- 
formacidn requerida de los datos. 

Sea .Ely) = /i la media dey, y suponga que la desviacidn estandar dey es proporcional a una potencia 
de la media de y tal que 


o y 

Quiere encontrarse una transformacidn dey que produzca una varianza constante. Suponga que la trans- 
formacion es una potencia de los datos originales, por ejemplo 

y* = y A (3-20) 


Puede demostrarse entonces que 


o y . (3-21) 

Evidentemente, si se hace X = 1 - a, la varianza de los datos transformados y* es constante. 

En la tabla 3-9 se resumen varias de las transformaciones comunes analizadas anteriormente. Obser- 
ve que X = 0 implica la transformation logaritmica. Estas transformaciones se enlistan en el orden de 
fuerza creciente. Por fuerza de una transformation se entiende la cantidad de curvatura que induce. Una 
transformacidn suave aplicada a datos que se extienden en un rango estrecho tiene escaso efecto sobre el 


labia 3-9 Transformaciones para estabilizar la varianza 


Relation entre 

a 

2=1 -a 

'Itansfonnatidn 

Comentario 

a v « constante 

0 

1 

Sin transformation 


0^, a /U V2 

1/2 

1/2 

Raiz cuadrada 

Datos (numeros) de Poisson 


1 

0 

Log 


Oy * fi ' 

3/2 

-1/2 

Raiz cuadrada retiproca 


o y «S 

2 

-1 

Reciproco 
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Figura 3-8 Grafica de log 5. contra logj^ para los datos de 
la descarga pico del ejemplo 3-5. 


an&lisis, mientras que una transformacion fuerte aplicada en un rango amplio puede tener resultados dra- 
m&ticos. Con frecuencia las transformaciones tienen escaso efecto a menos que el cocientey miSx /y mfn sea 
mayor que 2 o 3. 

En muchas situaciones de diserio experimental en las que se usan replicas, a puede estimarse empiri- 
camente a partir de los datos. Puesto que la combinacidn i-6simo de los tratamientos a « //“ = 9fi% 
donde 6 es una constante de proporcionalidad, pueden tomarse logaritmos para obtener 

log a yi = log 0 + a log // . (3-22) 

Por lo tanto, una gr&fica de log a y contra log//, serfa una linea recta con pendiente a. Puesto que no se co- 
nocen a y y //„ pueden sustituirse estimaciones razonables de ellos en la ecuacidn 3-22 y usar la pendiente 
del ajuste de la linea recta resultante como estimacion de a . De manera tipica, se usaria la desviacidn es- 
tandar S { y el promedioy, del tratamiento z-6simo (o, en terminos m^is generales, la combinacion i-6 sima 
de los tratamientos o conjunto de condiciones experimentales) para estimar Oy, y ftf 

Para investigar la posibilidad de usar una transformacion para estabilizar la varianza en los datos de 
la descarga pico del ejemplo 3-5, en la figura 3-8 se grafica log S, contra logy, . La pendiente de la recta que 
pasa por estos cuatro puntos esta cerca de 1/2 y, por la tabla 3-9, esto implica que la transformacidn de la 
rafz cuadrada puede ser apropiada. El analisis de varianza de los datos transformados v* = Vy se presenta 
en la tabla 3-10, y en la figura 3-9 se muestra una grafica de los residuales contra la respuesta predicha. 
Esta grafica residual muestra una mejorta sensible en comparacion con la figura 3-7, por lo que se conclu- 


Tabla 3-10 

Andlisis de varianza de los datos transformados de la descarga pico, y* = Vy 



Fuente de 
variacidn 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

F o 

Valor P 

Mdtodos 

32.6842 

3 

10.8947 

76.99 

<0.001 

Error 

2.6884 

19 

0.1415 



Total 

35.3726 

22 
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Figura 3-9 Gr&fica de los residuales de los datos transfor- 
mados contra y*- para los datos de la descarga pico del ejem- 
plo 3-5, 


ye que la transformaci6n de la raiz cuadrada ha sido util. Observe que en la tabla 3-10 se han reducido los 
grados de libertad del error en 1 para tomar en consideracidn el uso de los datos para estimar el par&me- 
tro de la transformation a. 

En la practica, muchos experimentadores seleccionan la forma de la transformacion probando varias 
alternativas y observando el efecto de cada transformation en la gr£fica de los residuales contra la res- 
puesta predicha. Entonces se selecciona la transformacion que produjo la gr&fica residual m&s satisfactoria. 


3 '4.4 Graficas de los residuales contra otras variables 

Si se han recolectado datos de cualesquiera otras variables que posiblemente pudieran afectar la respues- 
ta, los residuales deber^n graficarse contra estas variables* Por ejemplo, en el experimento de la resisten- 
cia a la tension del ejemplo 3-1, la resistencia puede ser afectada de manera significativa por el espesor de 
la fibra, por lo que los residuales deber&n graficarse contra el espesor de la fibra* Si se usaron diferentes 
maquinas de prueba para recolectar los datos, los residuales deber&n graficarse contra las maquinas. Los 
patrones en tales graficas residuales implican que la variable afecta la respuesta. Esto sugiere que la varia- 
ble deberia controlarse con mayor atencidn en experimentos futuros o que deberia incluirse en el an£lisis. 


3'5 INTERPRETACION PRACTICA DE LOS RESULTADOS 

DespuOs de realizar el experimento, llevar a cabo el analisis estadistico e investigar los supuestos funda- 
mentales, el experimentador estd listo para sacar conclusiones prdcticas acerca del problema bajo estu- 
dio, Muchas veces esto es relativamente f&cil, y ciertamente en los experimentos sencillos que se han 
considerado hasta este punto, esto podria hacerse de manera un tanto informal, tal vez mediante la ins- 
pection de las representaciones graficas, como los diagramas de cajay el diagrama de dispersidn de las fi- 
guras 3-1 y 3-2. Sin embargo, en algunos casos es necesario aplicar t6cnicas m^s formales, En esta seccidn 
se presentar&n algunas de ellas. 
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3-5.1 Un modelo de regresidn 

Los factores que intervienen en un experimento pueden ser cuantitativos o cualitativos* Un factor cuan- 
titativo es aquel cuyos niveles pueden asociarse con puntos en una escala num6rica, como la temperatura, 
la presidn o el tiempo, Los factores cualitativos, por otra parte, son aquellos cuyos niveles no pueden or- 
denarse por magnitud. Los operadores, los lotes de materia prima y los cambios de tumo son factores 
cualitativos tfpicos, ya que no existe ninguna raz6n para ordenarlos bajo algun criterio num£rico particular, 

En lo que se refiere al diseno inicial y al analisis del experimento, ambos tipos de factores se tratan de 
manera id6ntica. El experimentador esta interesado en determinar las diferencias, en caso de haberlas, 
entre los niveles de los factores. Si el factor es cualitativo, como los operadores, no tiene sentido conside- 
rar la respuesta de una corrida subsecuente en un nivel intermedio del factor. Sin embargo, con un factor 
cuantitativo como el tiempo, el experimentador tiene interns por lo general en el rango completo de los 
valores usados, particularmente la respuesta de una corrida subsecuente con un nivel intermedio del fac- 
tor. Es decir, si se usan los niveles 1.0, 2.0 y 3.0 en el experimento, tal vez quiera predecir la respuesta de 
2.5 horas. Por lo tanto, el experimentador tiene con frecuencia interns en desarrollar una ecuacidn de in- 
terpolacidn para la variable de respuesta del experimento. Esta ecuacion es un modelo empirico del pro- 
ceso que se ha estudiado, 

Al enfoque general para ajustar modelos empiricos se le llama an&lisis de regresidn, el cual se analiza 
en detalle en el capitulo 10. Vease tambi6n el material suplementario del texto para este capitulo. En esta 
seccidn se ilustra brevemente la tecnica utilizando los datos de la resistencia a la tensidn del ejemplo 3-1. 

En la figura 3-10 se presenta el diagrama de dispersidn de la resistencia a la tension y contra el peso 
porcentual del algoddnx en la tela para el experimento del ejemplo 3-1. Los circulos huecos de la gr&fica 
son las resistencias de tension promedio para cada valor x del peso porcentual del algoddn. A partir del 
examen del diagrama de dispersidn, es evidente que la relacidn entre la resistencia a la tensidn y el peso 



Figura 3-10 Diagrama de dispersidn para los datos 
de la resistencia a la tension del ejemplo 3-1. 
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porcentual del algoddn no es lineal. Como una primera aproximacion, podria intentarse ajustar un mode- 
lo cuadr&tico para los datos, por ejemplo 

y= Po + Pi x+ P2 * 2 +e 

donde yfi 2 son par&metros desconocidos que deberan estimarse y e es un termino del error aleatorio. 

El metodo que se usa con mayor frecuencia para estimar los parametros en un modelo como 6ste es el me- 
todo de minimos cuadrados. Este consiste en elegir estimaciones de las /? tales que minimicen la suma de 
cuadrados de los errores (las e). El ajuste de minimos cuadrados en el ejemplo que se considera aqui es 

y = - 39. 9886 + 4. 596* - 0. 0886* 2 

(Si el lector no est& familiarizado con los metodos de regresion, vea el capitulo 10 y el material suplemen- 
tario del texto para este capitulo.) 

En la figura 3-10 se muestra este modelo cuadr&tico. No parece muy satisfactory ya que subestima 
de manera drastica las respuestas para* — 30% de algodon y sobrestima las respuestas para* = 25%. 
Quizd pueda lograrse un mejoramiento agregando un termino cubico en*. El ajuste con el modelo cubico 
resultante es 


y= 62.6114- 9.0114*+ 0.4814* 2 - 0.0076* 3 

Este ajuste cubico se ilustra tambien en la figura 3-10. El modelo cubico parece mejor que el cuadratico 
porque proporciona un ajuste mejor para * = 25 y * = 30% de algodon. 

En general, seria preferible hacer el ajuste con el polinomio de orden menor que describa adecuada- 
mente el sistema o proceso. En este ejemplo, el polinomio cubico parece un mejor ajuste que el cuadrati- 
co, por lo que la complejidad adicional del modelo cubico se justifica. Sin embargo, seleccionar el orden 
del polinomio de aproximacion no siempre es f£cil, y es relativamente sencillo excederse en el ajuste, es 
decir, agregar polinomios de orden superior que no mejoran en realidad el ajuste pero que incrementan 
la complejidad del modelo y con frecuencia demeritan su utilidad como predictor o ecuacion de interpo- 
lacion. 

En este ejemplo, el modelo empirico podria usarse para predecir la resistenria a la tension media 
para los valores del peso porcentual del algoddn dentro de la region de experimentation. En otros casos, 
el modelo empirico podria usarse para la optimization del proceso, es decir, para encontrar los niveles de 
las variables del diseno que dan como resultado los mejores valores de la respuesta. Mas adelante se ana- 
lizaran e ilustraran en detalle estos problemas. 


3*5.2 Comparaciones entre las medias de los tratamientos 

Suponga que al hacer el analisis de varianza en el modelo con efectos fijos se rechaza la hipdtesis nula. Por 
lo tanto, hay diferencias entre las medias de los tratamientos, pero no se especifica exactamente cuales 
medias difieren. En ocasiones pueden ser de utilidad en esta situacion las comparaciones y los analisis 
adicionales entre grupos de las medias de los tratamientos. La media del tratamiento z-esimo se define 
como fii = // + r i9 yf.ii se estima cony, . Las comparaciones entre las medias de los tratamientos se hacenya 
sea en terminos de los totales de los tratamientos {y, } o bien de los promedios de los tratamientos {y, }. Es 
comun llamar a los procedimientos para hacer estas comparaciones metodos de comparaciones multi- 
ples. En varias de las secciones siguientes se analizan los metodos para hacer comparaciones entre las me- 
dias de los tratamientos individuales o de grupos de estas medias. 
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3-5.3 Comparaciones graficas de medias 

Es muy sencillo desarrollar un procedimiento gr£fico para la comparacidn de las medias despu6s de un 
an&lisis de varianza. Suponga que el factor de interns tiene a niveles y quey! ,y 2 ., ••*>%. son l° s promedios 
de los tratamientos. Si se conoce a , el promedio de cualquier tratamiento tendria una desviacidn est&ndar 
o/yfn. Por consiguiente, si todas las medias de los niveles del factor son identicas, las medias muestrales 
observadas y L se comportarian como un conjunto de observaciones tomadas al azar de una distribucion 
normal con mediay y desviacidn estandar o/Vn . Visualice una distribucion normal con la capacidad de ser 
deslizada sobre un eje abajo del cual estan graficadasyj ,y 2 , ...,y fl . Si todas las medias de los tratamientos 
son iguales, deber& haber una position de esta distribucidn que haga evidente que los valoresy, se sacaron 
de la misma distribucidn. Si no es este el caso, los valoresy, que no parecen haberse sacado de esta distri- 
bucion se asocian con los niveles del factor que producen respuestas medias diferentes. 

La unica falla en esta ldgica es que a es desconocida. Sin embargo, p uede susti tuirse o con ^ MS J del 
analisis de varianza y usar una distribucion t con un factor de escalation ^JMS E / n en lugar de la distribu- 
ci6n normal En la figura 3-11 se muestra este arreglo para los datos de la resistencia a la tension del ejem- 
plo 3-1. 

Para trazar la distribucion t de la figura 3-11, simplemente se multiplica el valor de la abscisa t por el 
factor de escalacidn 


tJMS e In — ^8.06 / 5 — 1.27 

y se grafica contra la ordenada de t en ese punto. Dada la gran similitud entre la distribucion t y la normal, 
excepto porque la primera es un poco m&s plana cerca del centro y tiene colas m&s largas, por lo general 
este trazo se construye f&cilmente a ojo. Si quiere obtenerse mayor precisidn, en Box, Hunter y Hunter 
[18] se incluye una tabla de los valores de las abscisas t y las ordenadas correspondientes. La distribucidn 
puede tener un origen arbitrario, aun cuando por lo general es mejor uno que estd en la region de los valo- 
res y L que van a compararse. En la figura 3-11, el origen es 15 lb/pulg 2 . 

Visualice ahora el desplazamiento de la distribucidn t de la figura 3-11 sobre el eje horizontal y exami- 
ne las cinco medias graficadas en la figura. Observe que no hay ninguna posicion de la distribucidn tal que 
los cinco promedios puedan considerarse como observaciones tipicas seleccionadas al azar de la distribu- 
tion, Esto implica que las cinco medias no son iguales; por lo tanto, la figura es una representation grafica 
de los resultados del an&lisis de varianza. La figura indica que 30% de algodon produce resistencias a la 
tensidn mucho m£s altas que 20 o 25 por ciento de algoddn (las cuales son aproximadamente iguales), y 
que 15 o 35 por ciento de algoddn (las cuales son aproximadamente iguales) producirian resistencias a la 
tension aun m&s bajas. 


L 
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15,35 

10 


.20 25 

-L* #- 

15 


_±_ 

20 



Resistencia a la tensidn promedio 
(lb/pulg 2 ) 


Figura 3-11 Promedio de la resistencia a la tension del experimento del peso 
porcentual del algodon en relacidn con una distribucidn t con un factor de es- 
calacidn / n = V 8.06 / 5 = 127, 
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Este procedimiento simple es una t6cnica aproximada pero eficaz en muchos problemas de compara- 
ciones multiples. Sin embargo, existen m^todos m&s formales. A continuation se presenta una breve revi- 
sion de algunos de estos procedimientos. 


3 -5 A Contrastes 

Muchos m£todos de comparaciones multiples utilizan el concepto de contraste. Considere el problema 
de la prueba de la fibra sint6tica del ejemplo 3-1. Puesto que se rechazd la hipotesis nula, se sabe que algu- 
nos pesos porcentuales del algoddn producen resistencias a la tensidn diferentes que otros, pero, £cu£les 
son los que causan en realidad esta diferencia? A1 principio del experimento podria sospecharse que los 
niveles 4 y 5 del peso porcentual del algoddn (30 y 35 por ciento) producen la misma resistencia a la ten- 
sion, lo cual implicarfa que la hipotesis por probar seria 

#0 * f* 4 = 5 


o, de manera equivalente, 

^0 ; i“4 “^5=° (3-23) 

H 1 :p 4 -fi s *0 

Si desde el principio del experimento se hubiera sospechado que el promedio de los niveles mas bajos del 
peso porcentual del algodon (1 y 2) no diferia del promedio de los niveles mas altos del peso porcentual 
del algodon (4 y 5), entonces la hipotesis habria sido 

H 0 \p 1 +fi 2 -p 4 +fi s 


o 


H 0 :fi l +fi 2 — p 4 - p s = 0 

H 1 :p 1 +p 2 -p 4 -p s =0 


(3-24) 


En general, un contraste es una combinacidn lineal de parametros de la forma 



donde las constantes de los contrastes c u c 2 , ...,c a suman cero; es decir, 2“ =1 c ; = 0. Las dos hipotesis ante- 
riores pueden expresarse en terminos de contrastes: 


#0 = 2 = 0 
;=i 
a 

i - 1 


(3-25) 


Las constantes de los contrastes para las hipotesis de la ecuacion 3-23 son c 2 ~ c 2 = c 3 = 0,c 4 = + 1 y c 5 = 
-1, mientras que para las hipdtesis de la ecuacion 3-24 son c 3 ~ c 2 = +1, c 3 = 0, y c 4 = c s = -1. 
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Las pruebas de hipdtesis que incluyen contrastes pueden hacerse de dos maneras basicas. En el pri- 
mer metodo se utiliza la prueba t. El contraste de interns se escribe en tlrminos de los totales de los trata- 
mlentos, obteniendose 

C-±c,y L 

i=i 

La varianza de C es 

(3-26) 

i=l 


cuando los tamanos de las muestras de cada tratamiento son iguales. Si la hipdtesis nula de la ecuacion 
3-25 es verdadera, el cociente 

2 ™ 


i=i 



tiene la distribucidn N( 0, 1). Entonces se sustituiria la varianza desconOcida a 2 con su estimation, el error 
cuadriitico medio MS E , y se utilizaria el estadlstico 


u 



(3-27) 


para probar las hipotesis de la ecuacidn 3-25. La hipdtesis nula se rechazaria si |f 0 | de la ecuacidn 3-27 ex- 
cede t al2< M-a- 

En el segundo enfoque se utiliza la prueba F. Entonces, el cuadrado de una variable aleatoria t con v 
grados de libertad es una variable aleatoria F con un grado de libertad en el numerador y v grados de li- 
bertad en el denominador. Por lo tanto, puede obtenerse 


^0 



(3-28) 


como un estadlstico F para probar la ecuacion 3-25. La hipdtesis nula se rechazaria si F 0 > F a l<N ^. Este es- 
tadistico de prueba de la ecuacidn 3-28 puede escribirse como 

„ MS C SS e n 
0 “ MS e - MS e 

donde la suma de cuadrados de los contrastes con un solo grado de libertad es 



i= 1 


(3-29) 
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Intervalo de confianza para un contraste 

En lugar de probar hipotesis acerca de un contraste, puede ser mis util construir un intervalo de confian- 
za. Entonces el contraste suele expresarse en terminos de los promedios de los tratamientos y,. Suponga 
que el contraste de interns es 

a 

r = X c,/r, 

i = 1 

A1 sustituir las medias de los tratamientos con los promedios de los tratamientos se obtiene 

c* X c,y t 

i= 1 



cuando los tamaiios de las muestras son iguales. Si se usa MS E para estimar a 2 , el intervalo de confianza de 
100(1 - a) por ciento para el contraste '2‘ =l c i fi i es 



i= 1 




i=i 


(3-30) 


Evidentemente, si este intervalo de confianza incluye al cero, no podria rechazarse la hipotesis nula en la 
ecuacion 3-25. 


Contraste estandarizado 

Cuando hay interes en mis de un contraste, con frecuencia es util evaluarlos en la misma escala. Una for- 
ma de hacer esto es estandarizando el contraste para que su varianza sea a 2 . Si el c ontraste se 

expresa en terminos de los totales de los tratamientos como 2 “ i=1 c. y . , al dividirlo por ^/n2“ =1 c? se obtendra 
un contraste estandarizado con varianza cr. Entonces el contraste estandarizado es en realidad 

t 

i=l 

donde 



Tamanos de las muestras desiguales 

Cuando los tamanos de las muestras de cada tratamiento son diferentes, se introducen modificaciones 
menores en los resultados anteriores. Primero, observe que la definicidn de un contraste requiere ahora 
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Otros cambios requeridos son directos. Por ejemplo, el estadistico t de la ecuacion 3-27 queda como 


a 



y la suma de cuadrados de los contrastes de la ecuacidn 3-29 queda como 



1-1 


3-5.5 Contrastes ortogonales 

Un caso especial util del procedimiento de la seccidn 3-5.4 es el de los contrastes ortogonales. Dos con- 
trastes con coeficientes {c t } y {d t } son ortogonales si 

2 c,d, = 0 

i*i 


o, para un diseno no balanceado, si 


2 n , c id, = 0 
i=l 

Para a tratamientos, el conjunto de a - 1 contrastes ortogonales hace la particidn de la suma de cuadrados 
debida a los tratamientos en a - 1 componentes independientes con un solo grado de libertad. Por lo tan- 
to, las pruebas que se realizan en los contrastes ortogonales son independientes. 

Existen varias maneras de elegir los coeficientes de los contrastes ortogonales para un conjunto de 
tratamientos. En general, algun elemento en la naturaleza del experimento deber£ sugerir las compara- 
ciones que son de interes. Por ejemplo, si hay a — 3 tratamientos, donde el tratamiento 1 es de control y 
donde los niveles del factor en los tratamientos 2 y 3 son de interns para el experimentador, los contrastes 
ortogonales apropiados podrian ser los siguientes: 


Ttatamiento 

Coeficientes de los 
contrastes ortogonales 

1 (control) 

-2 0 

2 (nivel 1) 

1 -1 

3 (nivel 2) 

1 1 


Observe que el contraste 1 con c, = -2, 1, 1 compara el efecto promedio del factor con el control, mientras 
que el contraste 2 con d x - 0, -1, 1 compara los dos niveles del factor de interns. 

En general, el m6todo de contrastes (o de contrastes ortogonales) es util para lo que se llama compa- 
raciones preplaneadas. Es decir, los contrastes se especifican antes de llevar a cabo el experimento y de 
examinar los datos. La razon de esto es que, si las comparaciones se seleccionan despu6s de examinar los 
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datos, la mayoria de los experimentadores construirian pruebas que corresponderfan con las diferencias 
grandes observadas en las medias. Estas diferencias grandes podrfan ser el resultado de la presencia de 
efectos reales o podrlan ser el resultado del error aleatorio. Si los experimentadores se inclinan consisten- 
temente a escoger las diferencias m£s grandes para hacer las comparaciones, inflar£n el error tipo I de la 
prueba porque es probable que, en un porcentaje inusualmente elevado de las comparaciones selecciona- 
das, las diferencias observadas ser&n el resultado del error. A1 examen de los datos para seleccionar las 
comparaciones de interes potencial se le llama con frecuencia curioseo o sondeo de datos. El mdtodo de 
Schefte para todas las comparaciones, el cual se comenta en la seccion siguiente, permite el curioseo o 
sondeo de datos. 

EJEMPLO 3-6 

Considere los datos del ejemplo 3-1. Hay cinco medias de los tratamientosy cuatro grados de libertad en- 
tre estos tratamientos. Suponga que antes de correr el experimento se especificd la siguiente serie de 
comparaciones entre las medias de los tratamientos (y sus contrastes asociados): 


Hipdtesis 

Contraste 

tfo^4=/<5 

Q= -3'4, + 3's. 


Q = yi. +y 3 -y4.-ys. 

=-“3 

ci 

1 

II 

Afl t = fl } + fl 4 + fl 5 

c. , = -y t . + 4y 2 -y 3 —y 4 -y s 


Observe que los coeficientes de los contrastes son ortogonales. Utilizando los datos de la tabla 3-4, se en- 
cuentra que los valores numdricos de los contrastes y de las sumas de cuadrados son los siguientes: 


Cj = - 1(108) +1(54) = —54 

C 2 = +1(49) +1(88)- 1(108)- 1(54) = -25 

C 3 = +1(49) -1(88) =-39 

C 4 = - 1(49) +4(77)- 1( 88) - 1(108) - 1(54) = 9 


ss Ci = 


(~ 54 ) 2 

5(2) 


ss 


Cl 


(-25f 

5(4) 


291.60 

31.25 


SS 


C 3 


(-39 ) 2 
5(2) 


= 152.10 


SS 


c. 


(9) 2 

5(20) 


= 0.81 


Tabla 3-11 Analisis de varianza de los datos de la resistencia a la tensidn 


Fuente de 
variacidn 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

F o 

Valor P 

Peso porcentual del algoddn 

475.76 

4 

118.94 

14.76 

<0.001 

contrastes ortogonales 






Q-fa = ju 5 

(291.60) 

1 

291.60 

36.18 

<0.001 

C 2 ljU ! + fa = + fa 

(31.25) 

1 

31.25 

3.88 

0.06 

C 3 - fa 

(152.10) 

1 

152.10 

18.87 

<0.001 

C 4 Afa = fa + fa + ju 4 + fa 

(0.81) 

X 

0.81 

0.10 

0.76 

Error 

161.20 

20 

8.06 



Total 

636.96 

24 
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Estas sumas de cuadrados de los contrastes hacen la partition completa de la suma de cuadrados de los 
tratamientos. Las pruebas de estos contrastes ortogonales se incorporan por lo general en el an&lisis de 
varianza, como se muestra en la tabla 3-11. Por los valores P se concluye que hay diferencias significativas 
entre los niveles 4 y 5 y 1 y 3 del peso porcentual del algoddn, pero que el promedio de los niveles 1 y 3 no 
difiere del promedio de los niveles 4 y 5 con el nivel a = 0.05, y que el nivel 2 no difiere del promedio de los 
otros cuatro niveles. 


3-5*6 M6todo de Scheffe para comparar todos los contrastes 


En muchas situaciones, los experimentadores pueden no conocer de antemano curies son los contrastes 
que quieren comparar, o pueden tener interns en m£s de a - 1 posibles comparaciones. En muchos experi- 
mentos de exploracidn, las comparaciones de interes s61o se descubren despu6s del examen preliminar de 
los datos. Schefte [98a] ha propuesto un metodo para comparar todos y cada uno de los contrastes posi- 
bles entre las medias de los tratamientos. En el m6todo de Scheff6, el error tipo I es a lo sumo a para cual- 
quiera de las comparaciones posibles. 

Suponga que se ha determinado un conjunto de m contrastes 

r « = c i«^i+c 2b ^ 2 + -+c au n„ u=l, m (3-31) 

en las medias de los tratamientos de interes. El contraste correspondiente de los promedios de los trata- 
mientos y L es 


c u =c lu y t +c 2u y 2 . + - +c M y a u= 1, 2 , ..., m 


y el error estdndar de este contraste es 



(3-32) 

(3-33) 


donde n, es el numero de observaciones en el tratamiento i-6simo. Puede demostrarse que el valor critico 
contra el que deber& compararse C u es 

S a , u =S c J(a-l)F a ^ N _ a (3-34) 

Para probar la hipdtesis de que el contraste T u difiere de manera significativa de cero, se compara C u con 
el valor critico. Si \C U \ > S Qi u , se rechaza la hipotesis de que el contraste T u es igual a cero. 

El procedimiento de Scheff6 puede usarse tambien para formar intervalos de confianza para todos 
los contrastes posibles entre las medias de los tratamientos. Los intervalos resultantes, por ejemplo C„ - 
S aiU < T u < C u + S aM , son intervalos de confianza simultineos por cuanto la probabilidad de que todos 
ellos sean verdaderos simult&neamente es al menos 1 - a. 

Para ilustrar el procedimiento, considere los datos del ejemplo 3-1 y suponga que los contrastes de in- 
terns son 

r 1 = / « 1 +/< 3 -/< 4 -^ 5 


y 


^2 — f*l 

Los valores numdricos de estos contrastes son 

c, = A +y 3 . “ A. “ A. 

= 9.80+17.60 - 21.60- 10.80 
= 5.00 
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= 9.80-21.60 
= -11.80 

y los errores estandar se encuentran con la ecuacion 3-33 como 

■V = (4/n,) = V8-06(l + l+l+l)/5 = 2.54 

y 

$c 2 =J MS et (4/«,) = V8.06(l+l)/5 = 1.80 

For la ecuacion 3-34, los valores crfticos de 1% son 

So.ou = S Cl ^1)W^ = 2.54^/4(4.43) = 10.69 

y 

$ 0 . 01,2 = $c 2 = 1-8074(443) = 7.58 

Puesto que |C X | < S 0 .oi,i> se concluye que el contraste I\ = + ,113 -ju 5 es igual a cero; es decir, no 

existe evidencia sdlida para concluir que las medias de los tratamientos 1 y 3 como grupo difieren de las 
medias de los tratamientos 4 y 5 como grupo. Sin embargo, como | C 2 1 > So.oi,2> se concluye que el contras- 
te r 2 = no es igual a cero; es decir, las resistencias medias de los tratamientos 1 y 4 difieren signifi- 
cativamente. 

En muchas situaciones pricticas, querrin compararse s61o pares de medias. Frecuentemente, es po- 
sible determinar cu&les son las medias que difieren probando las diferencias entre todos los pares de me- 
dias de los tratamientos. Por lo tanto, el interes se encuentra en los contrastes de la forma T = //, -fy para 
todai *j. Aun cuando el mdtodo de Scheffd podria aplicarse facilmente a este problema, no es el procedi- 
miento mis sensible para tales comparaciones. Se pasa ahora a la consideracidn de los metodos disenados 
especificamente para las comparaciones por pares entre todas las a medias poblacionales. 


3-5.7 Comparacion de pares de medias de tratamientos 

Suponga que el interes se encuentra en comparar todos los pares de a medias de tratamientos y que las hi- 
potesis nulas que quieren probarse son / /,,:// , = /<, para toda i 7' /. A continuacidn se presentan cuatro me- 
todos para hacer estas comparaciones. 


Prueba de Tukey 

Suponga que, despuds de un analisis de varianza en el que se ha rechazado la hipotesis nula de la igualdad 
de las medias de los tratamientos. quieren probarse todas las comparaciones de las medias por pares: 

U i 

para toda i *j. TUkey [Hid] propuso un procedimiento para probar hipotesis para las que el nivel de sig- 
nification global es exactamente a cuando los tamanos de las muestras son iguales y es a lo sumo a cuando 
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los tamanos de las muestras no son iguales. Este procedimiento puede usarse tambien para contraer los 
intervalos de confianza para las diferencias en todos los pares de medias. Para estos intervalos, el nivel de 
confianza simult&neo es de 100(1 -a ) por ciento cuando los tamanos de las muestras son iguales y de al 
menos 100(1 - a) por ciento cuando los tamanos de las muestras no son iguales. Se trata de un procedi- 
miento excelente para curiosear sobre los datos cuando el interns se centra en pares de medias. 

El procedimiento de Ilikey hace uso de la distribution del estadistico del rango studentizado 

nl&c y _ min 

q ~ yjMS E /n 

dondey m<i . vv m[ „ son las medias muestrales mayor y menor, respectivamente, sacadas de un grupo de p me- 
dias muestrales. La tabla VIII del apendice contiene los valores de q a (p,f), los puntos porcentuales a su- 
periores de q, donde / es el numero de grados de libertad asociados con MS,,. Para tamanos de las 
muestras iguales, la prueba de Tukey declara que dos medias son significativamente diferentes si el valor 
absoluto de sus diferencias muestrales excede 



(3-35) 


De manera equivalente, podria construirse una serie de intervalos de confianza de 100(1 - a) por ciento 
para todos los pares de medias de la siguiente manera: 


, , [ms7 _ [ms7 

yi.-y/.-9 a (a,f)^^-<fi.~p J .<y i ~y.+q a (a,f)^—^-, i*j. (3-36) 


Cuando los tamanos de las muestras no son iguales, las ecuaciones 3-35 y 3-36 quedan como 


y -y dl 

y, y, i 



T 


^ a 

ms e 

M) 


l n t n j) 


\ n ‘ n u 


(3-37) 


qja, f) 

V2 1 


MS, 


/ J L+ J_ X 

\ n , n JJ 


,i*j (3-38) 


respectivamente. A la versidn para tamanos de las muestras diferentes se le llama en ocasiones el procedi' 
miento Tukey-Kramer. 


EJEMPLO 3-7 

Para ilustrar la prueba de Tukey, se usan los datos del experimento del peso porcentual del algodon del 
ejemplo 3-1. Con a = 0.05 yf = 20 grados de libertad para el error, en la tabla VIII del apendice se obtie- 
ne 9 o.os(5, 20) = 4.23. Por lo tanto, por la ecuacion 3-35, 


9 0.05 20 ). 




= 5.37 
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y,. y s . y 2 . y*. 

9.8 10.8 15.4 17.6 21.6 


Figura 3-12 Resultados de la prueba de Tukcy. 


Por lo tanto, cualquier par de promedios de los tratamientos que difieran en valor absoluto por mas de 
5.37 implicaria que el par correspondiente de medias poblacionales son significativamente diferentes. 
Los cinco promedios de los tratamientos son 


A = 9.8 A. = 15-4 A. = 176 A. = 216 

y las diferencias en los promedios son 

y t -y 2 = 9.8-15.4= -5.6* 

X - 5>3. = 9-8-17.6= -7.8* 
y L - y 4 . = 9.8-21.6= -11.8* 

A "A. = 9.8-10.8= -1.0 
A. "A. =15.4-17.6= -2.2 
A.- A =15.4-21.6= -6.2* 
y 2 -A. =15.4-10.8= 4.6 

A. "A. =17.6-21.6= -4.0 
A. “A. =17.6-10.8= 6.8* 

A. -A. =21.6-10.8= 10.8* 


A. - 10.8 


Los valores marcados con asterisco indican pares de medias que son significativamente diferentes. Suele 
ser fitil trazar una gr&fica, como la de la figura 3-12, donde se subraya a los pares de medias que no difie- 
ren significativamente. Esta gr&fica da una indicacidn de que las medias de los tratamientos forman tres 
grupos: y fi 2 y /*3> y ^4- Sin embargo, la pertenencia a estos grupos no es del todo clara. 


Cuando se utiliza cualquiera de los procedimientos para probar las medias por pares, ocasionalmen- 
te se encuentra que la prueba F global del an&lisis de varianza es significativa, pero la comparacion de las 
medias por pares falla para revelar cualquier diferencia significativa. Esta situaci6n ocurre porque la 
prueba F considera simult6neamente todos los contrastes posibles en los que intervienen las medias de 
los tratamientos, no s61o las comparaciones por pares. Es decir, en los datos a la mano, quiza no todos los 
contrastes significativos sean de la forma fi, - fij. 

Algunos paquetes de software de computadora presentan comparaciones por pares con intervalos de 
confianza. Para el procedimiento de Tlikey, estos intervalos se calcularfan con la ecuacidn 3-36 o la 3-38, 
dependiendo de si los tamanos de las muestras son iguales o no. 

La deduccidn del intervalo de confianza de TUkey de la ecuacidn 3-36 para tamanos de las muestras 
iguales es directa. Para el estadistico del rango studentizado q se tiene 


W(y,, min(y ; -/4,) 


/) *l-a 
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Si mSx(y, -ft) - mm(y, -/ <,) es menor o igual que q a (a,f)j MS E / n, debe ser verdadero que | (y L -ft,) - (y y - 
/tj) | < q a (a, f)^MSjJn para cada par de medias. Por lo tanto, 

p -qm ~ y ‘- ~ y > fij ) ~ qa< ' a ’ W ?") =1 ~ a 


A1 reordenar esta expresidn para aislar ft, - ft j entre las desigualdades se Uegari al conjunto de intervalos 
de confianza simult&neos de 100(1 - a) por dento dado en la ecuacidn 3-38. 


El mgtodo de la diferencia significativa minima (LSD) de Fisher 
En este procedimiento se utiliza el estadistico F para probar H 0 yt t 



= Fi 


(3-39) 


Suponiendo una hipdtesis altemativa de dos colas, los pares de medias ft, y ft t se declararian significativa- 
mente diferentes si |y, -y ; | > t a/2 N ^MS E (l /«,.+!/ n j ). A la cantidad 


LSD = t 


a/2, ft— a 1 


rr 

i i ^ 


— -i — 

i 

i"« n j) 


(3-40) 


se le llama diferenda significativa minima. Si el diseno es balanceado, n l = n 2 = = n a = n,y 

(3- 41 ) 

Para usar el procedimiento LSD de Fisher, simplemente se compara la diferencia observada entre 
cada par de promedios con la LSD correspondiente. Si |y, -y, | > LSD, se concluye que las medias pobla- 
cionales ft, y /tj difieren. 


EJEMPLO 3-8 

Para ilustrar el procedimiento, si se usan los datos del experimento del ejemplo 3-1, la LSD con a = 0.05 es 

LSD = f = 2.086 = 3.75 

Por lo tanto, cualquier par de promedios de los tratamientos que difiera del valor absoluto por m&s de 
3.75 implicaria que el par correspondiente de medias poblacionales es significativamente diferente. Las 
diferencias en los promedios son 

y L -y 2 = 9.8-15.4= -5.6* 
y L -y 3 , = 9.8-17.6= -7.8* 
y t -y 4 = 9.8-21.6= -11.8* 

= 9.8-10.8= -1.0 
y 2 “5*3. =15.4-17.6= - 2.2 
y 2 -y 4 =15.4-21.6 = -6.2* 
y 2 -y 5 =15.4-10.8= 4.6* 

y 3 -y A =17.6-21.6= -4.0* 
y 3 .~y s . =17.6-10.8= 6.8* 

y 4 -y 5 =21.6-10.8= 10.8* 
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5i. y 5 . y 3 . y A . 

9*8 10.8 15.4 17.6 2L6 


Figura 3-13 Resultados del procedimiento LSD. 


Los valores marcados con asterisco indican pares de medias que son significativamente diferentes. 
En la figura 3-13 se resumen los resultados. Evidentemente, los unicos pares de medias que no difieren 
significativamente son Iy5y2y3, yel tratamiento 4 produce una resistencia a la tension significativa- 
mente mayor que los otros tratamientos. 


Observe que el riesgo global a puede inflarse de manera considerable al utilizar este m6todo. Especi- 
ficamente, cuando a se hace m4s grande, el error tipo I del experimento (el cociente del numero de expe- 
rimentos en los que se comete al menos un error tipo I y el numero total de experimentos) se hace grande. 


Prueba del rango multiple de Duncan 

Un procedimiento muy utilizado para comparar todos los pares de medias es la prueba del rango multiple 
desarrollada por Duncan [41]. Para aplicar la prueba del rango multiple de Duncan cuando los tamanos 
de las muestras son iguales, los a promedios de los tratamientos se arreglan en orden ascendente, y el 
error est^ndar de cada promedio se determina como 


5 


y,. 



(3-42) 


Para tamanos de las muestras desiguales, se sustituye n en la ecuacion 3-42 con la media arinonica n h del 
{/ij}, donde 



(3-43) 


Observe que si n x = n 2 ~ — = n a , n h = n. Enla tabla de Duncan de los rangos significativos (tabla VII 
del apdndice) se obtienen los valores r a (p,f) para p = 2, 3, donde a es el nivel de significacion y/es el 
numero de grados de libertad del error. Estos rangos se convierten en un conjunto de a - 1 rangos mini- 
mos de signification (por ejemplo, R p ) para p = 2, 3, a calculando 

R P = r a (p, f)S-, parap = 2, 3, ..., a (3-44) 

Entonces, se prueban las diferendas observadas entre las medias, empezando con la mas grande contra la 
menor, la cual se compararia con el rango minimo de significacidn R„. Despues se calcula la diferencia de 
la mayor y la segunda menor y se compara con el rango minimo de significacion R a _ 1 . Estas comparacio- 
nes se continuan hasta que todas las medias se han comparado con la media mayor. Por ultimo, se calcula 
la diferencia entre la segunda media mayor y la menor y se compara con el rango mi nim o de signification 
R a _ j. Este proceso se continua hasta que se han considerado las diferencias entre todos los a(a - 1)/2 pa- 
res de medias posibles. Si una diferencia observada es mayor que el rango de significacion minima corres- 
pondiente, se concluye que el par de medias en cuestion es significativamente diferente. Para evitar 
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contradicciones, ninguna de las diferencias entre un par de medias se considera significativa si las dos me- 
dias en cuestidn se localizan entre otras dos medias que no difieren significativamente. 


EJEMPLO 3*9 • 

La prueba del rango multiple de Duncan puede aplicarse al experimento del ejemplo 3-1. Recuerde que 
MS e = 8.06, N =* 25, n * 5, y hay 20 grados de libertad del error. Al arreglar los promedios de los trata- 
mientos en orden ascendente, se tiene 


A= 9.8 

y 5 . = 10.8 

r 2 . =15.4 
P 3. =17.6 
%. = 21.6 

El error estandar de cada promedio es S- = V8.06/5 — 1.27. En el conjunto de rangos significativos de la 
tabla VII del apendice para 20 grados de libertad y a - 0.05, se obtiene roosts 20) = 2.95, r 005 (3, 20) = 
3.10, r 0 . 05 (4, 20) = 3.18 y *0.05(5, 20) = 3.25. Por lo tanto, los rangos de signification minima son 

R* =*-0.05(2, 20)5- = (2.95X1.27) = 375 
R, = r 0 05 (3 20)5- = ( 3.10)(1. 27) = 3.94 
R$ = *”o.o5 (4, 20)5- = (3.18X1.27) = 4.04 
R s = r QQ} (5, 20)5-, = (3.25)(1.27)= 4.13 

Los resultados de las comparaciones serian 

4 vs. 1: 21.6 - 9.8 = 11.8 > 4.13 (R 5 ) 

4 vs. 5: 21.6 - 10.8 = 10.8 > 4.04 (i? 4 ) 

4 vs. 2: 21.6 - 15.4 = 6.2 > 3.94 (/? 3 ) 

4 vs. 3: 21.6 - 17.6 = 4.0 > 3.75 (R 2 ) 

3 vs. 1: 17.6 - 9.8 = 7.8 > 4.04 (i? 4 ) 

3 vs. 5: 17.6 - 10.8 = 6.8 > 3.95 (R 3 ) 

3 vs. 2: 17.6 - 15.4 = 2.2 < 3.75 (i? 2 ) 

2 vs. 1: 15.4 - 9.8 = 5.6 > 3.94 (i? 3 ) 

2 vs. 5: 15.4 - 10.8 = 4.6 > 3.75 (R 2 ) 

5 vs. 1: 10.8 - 9.8 = 1.0 < 3.75 (R 2 ) 

Por el anilisis se observa que hay diferencias significativas entre todos los pares de medias con exception 
de la 3 y la 2 y la 5 y la 1. En la figura 3-14 se muestra una grafica en la que esas medias que no son significa- 
tivamente diferentes aparecen subrayadas. Observe que en este ejemplo la prueba del rango multiple de 
Duncan y el metodo LSD llevan a conclusiones idcnticas. 


?i. y$. y 2 . y 2 . 

9.8 10.8 16.4 17.6 21.6 


Figura 3-14 Resultados de la prueba de rango multiple de Duncan. 



1 02 CAPlTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANALISIS DE VARIANZA 

En la prueba del rango multiple de Duncan se requiere una diferencia observada mas grande para de- 
tectar pares significativamente diferentes de medias, cuando el numero de medias incluidas en el grupo 
aumenta. De esta forma, en el ejemplo anterior R 2 = 3.75 (dos medias) mientras qu ef? 3 = 3.94 (tres me- 
dias). Para dos medias, el valor critico R 2 ser& exactamente igual al valor LSD de la prueba f. Los valores 
r a (p,f) de la tabla VII del apendice se eligen de ial modo que se obtenga un nivel de protection especifi- 
cado. Es decir, cuando se comparan dos medias que est&n p pasos aparte, el nivel de proteccidn es 
(1 - af ~ 1 , donde a es el nivel de significacibn especificado para dos medias adyacentes . Por lo tanto, el in- 
dice de error de reportar al menos una diferencia significativa incorrecta entre dos medias es 1 - (1 - a)^ 1 , 
cuando el tamano del grupo es p . Por ejemplo, si a = 0.05, entonces 1 - (1 - 0.05) 1 = 0.05 es el nivel de sig- 
nificacibn para comparar el par de medias adyacentes, 1 - (1 - 0.05) 2 = 0.10 es el nivel de significacibn 
para medias que est£n un paso aparte, y asi sucesivamente. 

En general, si el nivel de proteccidn es a, las pruebas de las medias tienen un nivel de significacibn 
que es mayor o igual que a, Por consiguiente, el procedimiento de Duncan tiene una gran potencia; es de- 
cir, es muy eficaz para detectar diferencias entre medias cuando existen diferencias reales. Por esta razdn, 
la prueba del rango multiple de Duncan es muy popular. 

La prueba de Newman-Keuls 

Esta prueba fue creada por Newman [90]. Debido a que un interbs renovado en la prueba de Newman fue 
generado por Keuls [64], al procedimiento se le llama la prueba de Newman-Keuls. Operacionalmente, el 
procedimiento es similar a la prueba del rango multiple de Duncan, salvo porque las diferencias crfticas 
entre las medias se calculan en una forma un tanto diferente. Especificamente, se calcula una serie de va- 
lores criticos 

K p = V«(P’f) S y, (3-45) 

donde q a (p,f) es el punto porcentual a superior del rango studentizado para grupos de medias de tamano 
p y con/grados de libertad del error. Una vez que se calculan los valores K p con la ecuacibn 3-45, los pares 
de medias extremos en los grupos de tamano p se comparan conK^ exactamente igual que en la prueba del 
rango multiple de Duncan. 

ZQu6 mbtodo de comparacibn por pares debe usarse? 

Ciertamente, una pregunta logica en este punto es que mbtodo de comparacibn por pares debe usarse. 
Desafortunadamente, no hay una respuesta precisa para esta pregunta, y los especialistas en estadistica 
est£n con frecuencia en desacuerdo en cuanto a la utilidad de los diferentes procedimientos. Carmer y 
Swanson [24] han realizado estudios de simulacibn Montecarlo con varios procedimientos de compara- 
ciones multiples, incluyendo algunos que no se han considerado aqui. Estos autores reportan que el me- 
todo de la diferencia significativa minima es una prueba muy eficaz para detectar diferencias reales en las 
medias si se aplica solo despu&s de que la prueba F en el analisis de varianza sea significativa en 5%. Re- 
portan asimismo un buen desempeno en la deteccibn de diferencias reales con la prueba del rango multi- 
ple de Duncan. Esto no es motivo de sorpresa, ya que estos dos mbtodos son los m&s poderosos de los que 
se han comentado aqui. Sin embargo, estos mbtodos no incluyen el indice de error en el modo del experi- 
mento. Debido a que el mbtodo de TUkey efectua un control sobre el indice de error global, muchos expe- 
rimentadores prefieren su uso. 

La prueba de Newman-Keuls es m&s conservadora que la prueba del rango multiple de Duncan por 
cuanto a que el indice de error tipo I es menor. Especificamente, el error tipo I del experimento es a para 
todas las pruebas que incluyen el mismo numero de medias. Por consiguiente, debido a que a es por lo ge- 
neral bajo, la potencia de la prueba de Newman-Keuls casi siempre es menor que la de la prueba del ran- 
go multiple de Duncan. Para demostrar que el procedimiento de Newman-Keuls lleva a una prueba con 
menor potencia que la prueba del rango multiple de Duncan, se observa por una comparacibn de las ta- 
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bias Vlly VIII del apendice que parap > 2 se tiene q a (pf) > r a (p,f). Es decir, es “mas dificil” declarar que 
un par de medias es significativamente diferente al utilizar la prueba de Newman-Keuls que cuando se 
usa el procedimiento de Duncan. Esto se ilustra a continuation para el caso en que a = 0.01, a = 8 yf = 20: 


p 

2 

3 

4 

5 

6 

7 

8 

r :un(P, 20) 

4.02 

4.22 

4.33 

4.40 

4.47 

4.53 

4.58 

q om (p, 20) 

4.02 

4.64 

5.02 

5.29 

5.51 

5.69 

5.84 


Como se senald antes, existen otros procedimientos de comparaciones multiples. Algunos artfculos 
que describen estos m6todos son los de Miller [78], O’Neill y Wetherill [91] y Nelson [89]. Ikmbien se re- 
comienda el libro de Miller [77]. 

3*5.8 Comparacidn de medias de tratamientos con un control 

En muchos experimentos, uno de los tratamientos es un control, y el analista se interesa en comparar 
cada una de las medias de los a - 1 tratamientos restantes con el control. Por lo tanto, solo es necesario ha- 
cer a - 1 comparaciones. Un procedimiento para hacer estas comparaciones ha sido desarrollado por 
Dunnett [42]. Suponga que el tratamiento a es el control y que quieren probarse las hipotesis 

H 0 :(i i =M a 


para i = 1, 2, ..., a - 1. El procedimiento de Dunnett es una modification de la prueba t comun. Para cada 
hipotesis se calculan las diferencias observadas en las medias muestrales 

I y,. — I i = l, 2, ..., a-1 

La hipotesis nula = fi a se rechaza utilizando un indice a de error tipo I si 


I y,.-yJ>d a (a-i,f). 



(1 1 ) 

MS E 

— + — 

II ' 

\ n i n * i 


(3-46) 


donde la constante d a (a - 1 ,/) se da en la tabla IX del apendice. (Pueden hacerse pruebas tanto de una 
como de dos colas.) Observe que a es el nivel de signification conjunto asociado con las a - 1 pruebas. 


3JEMPLO 3*10 

Para ilustrar la prueba de Dunnett, considere el experimento del ejemplo 3-1, asumiendo que el trata- 
miento 5 es el control. En este ejemplo, a = 5, a - 1 = 4,/ = 20 y n, = n = 5. Con el nivel de 5%, en la tabla 
IX del apendice se encuentra que d aQ5 (A, 20) = 2.65. Por lo tanto, la diferencia critica es 


^o.o5 20)y ^ — 2.65^1 „ —4.76 


(Observe que se trata de una simplificacion de la ecuacion 3-46 que resulta de un disefio balanceado.) Por 
lo tanto, cualquier media de los tratamientos que difiera del control por mas de 4.76 se declararia signifi- 
cativamente diferente. Las diferencias observadas son 


1 vs. 5: y L - y s = 

2 vs. 5: y 2 , - y 5 , = 

3 vs. 5: y 3 . - y 5 . = 

4 vs. 5: y 4 -y 5 _ = 


9.8 - 10.8= -1.0 
15.4-10.8= 4.6 
17.6-10.8= 6.8 
21.6 - 10 . 8 = 10.8 
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Solo las diferentiasy 3 . -y 5m y y 4- -y 5 indican alguna diferencia significativa cuando se comparan con el con- 
trol; por lo tanto, se concluye que * p 5 y * /* 5 . 

Cuando se hace la comparacion de los tratamientos con un control, una buena idea es usar m£s obser- 
vaciones para el tratamiento de control (por ejemplo, n a ) que para los demas tratamientos (por ejemplo, 
n ), suponiendo un numero igual de observaciones para los a - 1 tratamientos restantes. El cociente njn 
deberd elegirse de tal modo que sea aproximadamente igual a la raiz cuadrada del numero total de trata- 
mientos. Es decir, se elige njn = Ja> 


3-6 MUESTRA DE SALIDA DE COMPUTADORA 


Hay una gran cantidad de programas de computadora para apoyar el diseno experimental y la realization 
de analisis de varianza. En la figura 3-15 se muestra la salida de uno de estos programas, Design-Expert 9 
utilizando los datos del experimento con un solo factor del ejemplo 3-1. La suma de cuadrados correspondien- 
te al “Modelo” (“Model”) es la 5Sit atamientos usual de un diseno con un solo factor. Esa fuente se identifica adi- 
cionalmente como “A”. Cuando hay mas de un factor en el experimento, la suma de cuadrados (“Sum of 
Squares”) del modelo se descompondra en van as fuentes (A 9 B 9 etc.). Observe que el resumen del anftlisis 
de varianza de la parte superior de la salida de computadora contiene las sumas de cuadrados, los grados de 
libertad (“DF”, degrees of freedom), los cuadrados medios (“Mean Square”) y el estadistico de pruebaF 0 
(“F Value”) acostumbrados. La columna “Prob > F” es el valor P (de hecho, el lmrite superior del valor P 7 
ya que a las probabilidades menores que 0,0001 se les asigna el valor por omisidn 0.0001). 

Ademas del an&lisis de varianza basico, el programa presenta informacidn adicional util. La cantidad 
“R cuadrada” (“R-Squared”) se define como 


R 2 


Modelo 
SS Total 


475.76 

636.96 


= 0.746923 


y se interpreta en tSrminos generates como la proportion de la variabilidad en los datos “explicada” por el 
modelo del an&lisis de varianza. Por lo tanto, en los datos para probar la resistencia de la fibra sint6tica, el 
factor “peso porcentual del algodon” explica cerca de 74.69% de la variabilidad en la resistencia a la ten- 
sion. Evidentemente, debe tenerse 0 < R 2 ^ 1, siendo m&s deseables los valores m&s grandes. En la salida 
se presentan tambitii otros estadisticos en R 2 . R 2 “ajustada” (“Adj R-Squared”) es una variante del esta- 
distico R 2 comun que refleja el numero de factores presentes en el modelo. Puede ser un estadistico litil 
en experimentos mas complejos en los que intervienen varios factores en el diseno, cuando quiere eva- 
luarse el impacto de aumentar o disminuir el numero de terminos del modelo. “Desviacidn est&ndar” 
(“Std. Dev.”) es la raiz cuadra da del cuadrado medio del error, V8.060 = 2.839, y “C.V” es el coeficiente 
de variacidn, definido como (JMS e ~ / y)100. El coeficiente de variacidn mide la variabilidad no explicada 
o residual de los datos como un porcentaje de la media (“Mean”) de la variable de respuesta. “PRESS” 
son las siglas de Prediction Error Sum of Squares (suma de cuadrados del error de predicridn) y es una me- 
dida de la adecuacion con que es posible que el modelo del experimento predecira las respuestas en un 
nuevo experimento . Son deseables valores pequenos de PRESS. Altemativamente, puede calcularse una 
R 2 para predicciones con base en PRESS (m&s adelante se indicard como hacer esto). Esta i?p red (“Pred 
R-Squared”) para el problema tratado aqui es 0.6046, el cual no es irrazonable, considerando que el mo- 
delo explica cerca de 75% de la variabilidad del experimento en curso. El estadistico “Prediccion adecua- 
da” (“Adeq Precision”) se calcula dividiendo la diferencia entre la respuesta predicha maxima y la 
respuesta predicha minima por la desviacidn est^ndar promedio de todas las respuestas predichas. Son 
deseables valores grandes de esta cantidad, y los valores que exceden cuatro indican por lo general que el 
modelo tendrd un desempeno razonable en la prediccion. 



Util ice el mouse para posicionarse en una celda y su definicion. 


Response: Strength in psi 

ANOVA for Selected Factorial Model 
Analysis of variance table [Partial sum of squares] 


Source 

Sum of 
Squares 

DF 

Mean 

Square 

F 

Value 

Prob > F 


Model 

475.76 

4 

118.94 

14.76 

<0.0001 

significativo 

A 

475.76 

4 

118.94 

14.76 

<0.0001 


Residual 

Lack of Fit 
Pure Error 
Cor Total 

161.20 

0.000 

161.20 

636.96 

20 

0 

20 

24 

8.06 

8.06 





El valor F del Modelo de 14.76 implica que el modelo es significativo. Sblo hay una probabilidad de 
0.01% de que un "Valor F del Modelo" de esta magnitud pudiera ocurrir debido a ruido. 

Los valores de "Prob > P menores que 0.0500 indican que los tbrminos del modelo son sjgnificativos. 


En este caso A son tbrminos significativos del modelo. 

Los valores mayores que 0.1000 indican que los tbrminos del modelo no son significativos. 

Si hay muchos tbrminos del modelo no significativos (sin contar los que se necesitan para apoyar 
la jerarquizacibn), la reduccibn del modelo puede mejorarlo. 


Std. Dev. 2.84 

Mean 15.04 

C.V. 18.88 

PRESS 251.88 


R-Squared 
Adj R-Squared 
Fred R-Squared 
Adeq Precision 


0.7469 

0.6963 

0.6046 

9.294 


La "R cuadrada predicha" de 0.6046 concuerda razonablemente con la "R cuadrada ajustada" de 
0.6963. Una diferencia mayor que 0.20 entre la H cuadrada predicha" y la "R cuadrada ajustada" 
indica un posible problems con el modelo y/o los datos. 


"Precisibn adecuada" mide la relacibn de la serial a ruido. Es deseable una relacibn mayor que 4. 
La relacibn de 9.294 indica una sefial adecuada para usar este modelo para navegar el espacio 
del diseno. 

Treatment Means (Adjusted, If Necessary) 

Estimated Standard 



Mean 


Error 



1-15 

9.80 


1.27 



2-20 

15.40 


1,27 



3-25 

17,60 


1.27 



4-30 

21.60 


1,27 



5-35 

10.80 


1.27 




Mean 


Standard 

t for H 0 

Prob > 1 1 

Treatment 

Difference 

DF 

Error 

Coeff=0 

1 vs 2 

“5.60 

1 

1.80 

-3.12 

0.0054 

1 vs 3 

-7.80 

1 

1.80 

-4.34 

0.0003 

1 vs 4 

-11.80 

1 

1.80 

-6.67 

<0.0001 

1 vs 5 

-1.00 

1 

1.80 

-0.56 

0.6838 

2 vs 3 

-2.20 

1 

1.80 

-1.23 

0.2347 

2 vs 4 

-6.20 

1 

1.80 

-3.45 

0.0025 

2 vs 5 

4.60 

1 

1.80 

2.56 

0.0186 

3 vs 4 

-4.00 

1 

1,80 

-2.23 

0.0375 

3 vs 5 

6.80 

1 

1.80 

3.79 

0.0012 

4 vs 5 

10.80 

1 

1.80 

6.01 

<0.0001 


Los valores de "Prob > |t|" menores que 0,0500 indican que la diferencia en las medias de los 
dos tratamientos es significativa. 

Los valores de "Prob > |t|" mayores que 0.1000 indican que la diferencia en las medias de los 
dos tratamientos no es significativa. 


Figura 3-15 Salida de computadora de Design-Expert para el ejemplo 3-1. 
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Diagnostic Case Statistics 


Standard 

Actual 

Predicted 



Student 

Cook's 


Order 

Value 

Value 

Residual 

Leverage 

Residual 

Distance 

Outlier t 

1 

7.00 

9.80 

-2.80 

0,200 

“1.103 

0.061 

-1,109 

2 

7.00 

9.80 

-2.80 

0.200 

-1.103 

0.061 

-1.109 

3 

15.00 

9.80 

5.20 

0.200 

2.048 

0,210 

2.245 

4 

11.00 

9.80 

1.20 

0.200 

0.473 

0.011 

0.463 

5 

9.00 

9.80 

-0.80 

0.200 

-0.315 

0,005 

-0.308 

6 

12.00 

15.40 

-3.40 

0.200 

-1.339 

0.090 

-1.368 

7 

17.00 

15.40 

1.60 

0.200 

0.630 

0.020 

0.620 

8 

12.00 

15.40 

-3.40 

0.200 

-1,339 

0.090 

-1.368 

9 

18.00 

15.40 

2.60 

0.200 

1.024 

0.052 

1.025 

10 

18.00 

15.40 

2.60 

0,200 

1.024 

0.052 

1.025 

11 

14.00 

17.60 

-3.60 

0.2Q0 

-1.418 

0.100 

-1,457 

12 

18.00 

17.60 

0.40 

0.200 

0.158 

0,001 

0.154 

13 

18.00 

17.60 

0.40 

0,200 

0.158 

0.001 

0.154 

14 

19.00 

17.60 

1.40 

0.200 

0.551 

0.015 

0.542 

15 

19.00 

17.60 

1.40 

0.200 

0.551 

0.015 

0.542 

16 

19.00 

21.60 

-2.60 

0,200 

-1.024 

0.052 

-1.025 

17 

25.00 

21.60 

3.40 

0,200 

1.339 

0.090 

1.368 

18 

22.00 

21.60 

0.40 

0,200 

0.158 

0.001 

0.154 

19 

19,00 

21.60 

-2.60 

0,200 

-1,024 

0.052 

-1.025 

20 

23.00 

21.60 

1.40 

0.200 

0.551 

0.015 

0.542 

21 

7.00 

10.80 

-3.80 

0,200 

-1.496 

0.112 

-1,548 

22 

10.00 

10.80 

-0.80 

0,200 

—0.315 

0.005 

-0.308 

23 

11.00 

10.80 

0.20 

0,200 

0,079 

0.000 

0.077 

24 

15.00 

10.80 

4.20 

0.200 

1.654 

0.137 

1*735 

25 

11.00 

10.80 

0.20 

0.200 

0.079 

0.000 

0.077 


Proceder con las grdficas de diagnostics (el icono slgulente en progresion). Asegurarse de examinar: 

1) La grafica de probabilidad normal de los residuales studentizados para verrficar la normalidad 
de los residuales. 

2) Los residuales studentizados contra los valores predichos para verificar la constante del error. 

3) Los puntos atipicos t contra el orden de las corridas para buscar puntos atipicos, 
es decir, valores influyentes o importantes 

4) La grafica de Box-Cox para las transformaciones de potencia. 

Si todos los estadisticos del modelo y las grSficas de diagndstico est£n correctos, finalizar con el icono 
Model Graphs (Gr£ficas del Modelo). 

Figura 3-15 (Continuacidn.) 


Se hace la estimacidn de las medias (“Estimated Mean”) de los tratamientos y se muestra el error es- 
t&ndar (“Standard Error”) (o desviacidn est&ndar muestral de la media de cada tratamiento, ^MS E In ). 
Las diferencias entre pares de medias (“Mean Difference”) de los tratamientos se investigan utilizando el 
mdtodo LSD de Fisher descrito en la seccidn 3-5.7. 

El programa de computadora tambidn calcula y despliega los residuales, segun se definen en la ecua- 
cion 3-16. El programa producira tambidn todas las gr&ficas de los residuales que se comentaron en la sec- 
ci6n 3-4. En la salida se muestran asimismo varios diagndsticos residuales m&s. Algunos de ellos se 
revisar&n m£s adelante. 

Por ultimo, observe que el programa de computadora incluye tambidn algunas guias para hacer la in- 
terpretacidn. Esta information “aconsejable” es muy comun en muchos paquetes de estadistica para 
computadoras personates. A1 leer estas guias, recuerde que est£n escritas en terminos muy generates, y 
quiza no se ajusten exactamente a los requerimientos de redaccidn del reporte de un experimentador par- 
ticular. Esta salida aconsejable puede ser eliminada por el usuario. 
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3-7 DETERMINACION DEL TAMANO DE LA MUESTRA 

En cualquier problema de diseno experimental, una decision critica es la election del tamano de la mues- 
tra; es detir, detenninar el numero de replicas que deben correrse. En general, si el experimentador tiene 
interes en detectar efectos pequenos, se necesitan mas replicas que cuando el experimentador se interesa 
en detectar efectos grandes. En esta section se analizan varios enfoques para determinar el tamano de la 
muestra. Aun cuando la revision se centra en un diseno con un solo factor, la mayoria de los mOtodos pue- 
den usarse en situationes experimentales mas complejas. 


3-7.1 Curvas de operation caracteristica 

Recuerde que una curva de operation caracteristica es una grifica de la probabilidad del error tipo II de 
una prueba estadistica para un tamano de la muestra particular contra un parametro que refleja la medi- 
da en que la hipOtesis nula es falsa. El experimentador puede usar estas curvas como guia en la selection 
del numero de replicas para que el diseno sea sensible a diferencias potentiates importantes en los trata- 
mientos. 

Se considera la probabilidad del error tipo II del modelo con efectos fijos para el caso en que se usa el 
mismo tamano de las muestras en cada tratamiento, por ejemplo 

/? = 1 - P{Rechazar H a \ H 0 es falsa} ^ 

= l-i>{F 0 >F a>a _^.J/f 0 esfalsa} 

Para evaluar el enuntiado de probabilidad de la ecuaciOn 3-47, es necesario conocer cual es la distribu- 
tion del estadistico de prueba F 0 si la hipOtesis nula es falsa. Puede demostrarse que, si H 0 es falsa, el esta- 
distico F 0 ~ MS^^JMSe se distribuye como una variable aleatoria F no central con a - 1 y N - a 
grados de libertad y pariunetro de no centralidad d. Si d = 0, la distribution F no central se convierte en la 
distribution F (central) comun. 

Las curvas de operation caracteristica que se presentan en la parte V del apOndice se usan para eva- 
luar el enuntiado de probabilidad de la ecuaciOn 3-47. En estas curvas se grafica la probabilidad del error 
tipo II (f$) contra un parlmetro <&, donde 



<D 2 = — - 2 ■ (3-48) 

ao 

La cantidad <J> 2 estO relacionada con el parametro de no centralidad d. Se cuenta con curvas para a = 0.05 
y a = 0.01 y un rango de grados de libertad para el numerador y el denominador. 

A1 usar las curvas de operation caracteristica, el experimentador debe especificar el parOmetro c£>. 
Con frecuencia es dificil hacer esto en la practica. Una manera de determinar <t> es elegir los valores reales 
de las medias de los tratamientos para los que querria rechazarse la hipOtesis nula con una alta probabili- 
dad. Por lo tanto, si Fi> /u 2 , •••> Fa son las raedias de los tratamientos especificadas, la r, de la ecuaciOn 3-48 
se encuentra como r, = Ft ~F, donde f = (l/«)2f =l . es el promedio de las medias de los tratamientos 
individuales. Se requiere asimismo una estimation de cr 2 . En ocasiones se cuenta con este valor por expe- 
riencia previa, un experimento anterior o una prueba preliminar (como se sugiriO en el capitulo 1), o por 
una estimation discretional. Cuando no se tiene la seguridad acerca del valor de a 2 , los tamahos de las 
muestras podrfan determinarse para un rango de valores posibles de o 2 , a fin de estudiar el efecto de este 
pariimetro sobre el tamano de la muestra requerido, antes de hacer la election final. 



108 CAPfTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANAUSIS DE VARIANZA 

EJEMPL0 3-11 

Considere el experimento de laresistencia a la tension descrito en el ejemplo 3-1. Suponga que el experi- 
mentador est£ interesado en rechazar la hipbtesis nula con una probabilidad de al menos 0.90 si las me- 
dias de los cinco tratamientos son 


Ai=H ^ 2=12 ^ 3 = 15 ^4=18 y h 5 =\9 

Planea utilizar a = 0.01. En este caso, puesto que 2f S5l /t i = 75, se tiene JI = (1/5)75 = 15 y 

tj = n 1 -Ji = 11- 15*= -4 
t 2 = n 2 -Ji = 12-15=-3 
r 3 = = 15- 15= 0 

t 4 = /< 4 -Ji = 18-15= 3 
t 3 = fi 5 — Ji = 19-15= 4 


Por lo tanto, = 50. Suponga que el experimentador piensa que la desviacibn estbndar de la resis- 
tencia a la tension con cualquier nivel particular del peso porcentual del algodbn no sera mayor que o=3 
psi. Entonces, al utilizar la ecuacibn 3-48, se tiene 


d > 2 


5 



1.1 In 


Se usa la curva de operacibn caracterfstica para a-l = 5- l = 4 con N-a = a(n - 1) = 5(n - 1) grados de 
libertad del error y a = 0.01 (ver la parte V del apbndice). Como primera conjetura para el tamano de la 
muestra requerido, se prueba con n = 4 rbplicas. Esto produce <& 2 = 1.11(4) = 4.44,0 = 2.11 y 5(3) = 15 
grados de libertad del error. Por consiguiente, en la parte V se encuentra que /J =0.30. Por lo tanto, la po- 
tencia de la prueba es aproximadamente 1 -/J = 1 - 0.30 = 0.70, que es menor que el 0.90 requerido, por 
lo que se concluye que n = 4 replicas no son suficientes. Procediendo de manera similar, puede construir- 
se la siguiente tabla: 


ft 

02 

<I> 

a(n - 1) 

fi 

Potencia (1 -fi) 

4 

4.44 

2.11 

15 

0.30 

0,70 

5 

5.55 

2.36 

20 

0.15 

0.85 

6 

6.66 

2.58 

25 

0.04 

0.96 


Por lo tanto, deben realizarse al menos ti- 6 rbplicas para ootener una prueba con la potencia requerida. 


El unico problema con este enfoque para usar las curvas de operacibn caracterfstica es que por lo general 
es diffcil seleccionar el conjunto de las medias de los tratamientos en el que se basar& la decisibn del tama- 
no de la muestra. Un enfoque alternative es seleccionar un tamano de la muestra tal que si la diferencia 
entre las medias de dos tratamientos cualesquiera excede un valor especificado, la hipbtesis nula debera 
rechazarse. Si la diferencia entre las medias de dos tratamientos cualesquiera es tan grande como D, pue- 
de demostrarse que el valor minimo de d> 2 es 


& 


«D 2 

2aa 2 


(3-49) 
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Puesto que este es un valor minimo de O z , el tamano de la muestra correspondiente que se obtiene de la 
curva de operacidn caracteristica es un valor conservador; es decir, proporciona una potencia al menos 
tan grande como la que especifico el experimentador. 

Para ilustrar este enfoque, suponga que en el experimento de la resistencia a la tension del ejemplo 
3-1, el experimentador quisiera rechazar la hipotesis nula con una probabilidad de al menos 0.90 si las me- 
dias de dos tratamientos cualesquiera difieren hasta en 10 psi. Entonces, suponiendo que a = 3 psi, se en- 
cuentra que el valor minimo de 3> 2 es 


4> z 


n(10) z 

2(5)(3 Z ) 


= l.lln 


y, por el an&lisis del ejemplo 3-11, se concluye que se necesitan n = 6 replicas para obtener la sensibilidad 
deseada cuando a = 0.01. 


3*7.2 Especificacidn de un incremento de la desviacidn estindar 

Este enfoque es util en ocasiones para elegir el tamano de la muestra. Si las medias de los tratamientos no 
difieren, la desviacidn estindar de una observacidn elegida al azar es a. Sin embargo, si las medias de los 
tratamientos son diferentes, la desviacidn estindar de una observacidn elegida al azar es 



Si se escoge un porcentaje P para el incremento de la desviacidn est&ndar de una observacidn, mas alii del 
cual quiera rechazarse la hipotesis de que las medias de todos los tratamientos son iguales, esto es equiva- 
lente a escoger 



(a \ 

h 

\i* i / 


a 


= 1 + 0.01P 


(P = por ciento) 


o 


de donde 



= V(1+0.01P) 2 -1 


<b= 


a 



al4n 


= V(i+o.oiP) 2 -i(V^) 


(3-50) 


Por lo tanto, para un valor especificado de P, puede calcularse con la ecuaridn 3-50 y despuds usar las 
curvas de operacidn caracteristica de la parte V del apendice para determinar el tamano de la muestra re- 
querido. 
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Por ejemplo, en el experimento de la resistencia a la tension del ejemplo 3-1, suponga que se desea 
detectar un incremento de la desviacion estandar de 20% con una probabilidad de al menos 0.90 y a — 
0.05. Entonces 

<& = V ( 1 - 2 ) 2 - l(Vn)- 0.66 -fn 

La referenda a las curvas de operation caracteristica indica que se necesita n- 9 para obtener la sensibi- 
lidad deseada. 


3-7.3 Mdtodo para estimar el intervalo de confianza 

En este enfoque se supone que el experimentador quiere expresar los resultados finales en tdrminos de 
intervalos de confianza y que estd dispuesto a especificar por anticipado cual es el ancho que desea para 
estos intervalos de confianza. Por ejemplo, suponga que en el experimento de la resistencia a la tensidn 
del ejemplo 3-1 se quiere que un intervalo de confianza de 95% para la diferenda en la resistencia a la 
tenstfn media de dos pesos porcentuales del algoddn cualesquiera sea ± 5 psi y una estimacidn previa de a 
es 3. Entonces, al utilizar la ecuacidn 3-13, se encuentra que la precisi6n del intervalo de confianza es 

\2MS f 
±i — 

- t al2,N-„V 


Suponga que se prueba con n = 5 replicas. Entonces, al usar a 2 = 3 2 = 9 como una estimation de MS E , la 
precision del intervalo de confianza es 


±2.086. 


/ 

i 5 


= ±3.96 


que es m&s preciso que el requerimiento. Al probar con n = 4 se obtiene 

±2.132^ 

Al probar con n = 3 se obtiene 


IM- 


= ±4.52 


±2.228^ 


2(9) 


= ±5.46 


Evidentemente, n = 4 es el tamano de la muestra menor que llevara a la precision deseada. 

El nivel de significaciOn consignado en el ejemplo anterior se aplica a un solo intervalo de confianza. 
Sin embargo, puede usarse el mismo enfoque general si el experimentador desea especificar de antemano 
un conjunto de intervalos de confianza acerca del cual se hace un enunciado de confianza simult&neo o 
conjunto (ver los comentarios acerca de los intervalos de confianza simultaneos de la seccion 3-3.3). Ade- 
m&s, los intervalos de confianza podrfan construirse con respecto a contrastes mds generales en las me- 
dias de los tratamientos, que la comparaciOn por pares ilustrada antes. 


3-8 IDENTIFICACION DE EFECTOS DE DISPERSI6N 

Nos hemos enfocado aqui en el uso del anilisis de varianza y de otros mOtodos relacionados para determi- 
nar los niveles del factor que resultan en diferencias entre las medias de los tratamientos o los niveles del 
factor. Se acostumbra referirse a estos efectos como efectos de localizacion. Cuando ocurrid la desigual- 
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Tabla 3-12 Datos del experiment de fundici6n 


Algoritmo para 
controlar la 
proportion 



Observaciones 



1 

2 

3 

4 

5 

6 

1 

4.93(0.05) 

4.86(0.04) 

4.75(0.05) 

4.95(0.06) 

4.79(0.03) 

4.88(0.05) 

2 

4.85(0.04) 

4.91(0.02) 

4.79(0.03) 

4.85(0.05) 

4.75(0.03) 

4.85(0.02) 

3 

4.83(0.09) 

4.88(0.13) 

4.90(0.11) 

4.75(0.15) 

4.82(0.08) 

4.90(0.12) 

4 

4.89(0.03) 

4.77(0.04) 

4.94(0.05) 

4.86(0.05) 

4.79(0.03) 

4.76(0.02) 


dad de la varianza con los diferentes niveles del factor, se utilizaron transformaciones para estabilizar la 
varianza y mejorar asi las inferences hechas sobre los efectos de localizacidn. Sin embargo, en algunos 
problemas el inter6s se centra en descubrir si los diferentes niveles del factor afectan la variabilidad; es 
decir, el interns est£ en descubrir efectos de dispersidn potenciales. Esto ocurrird siempre que la desvia- 
ci6n estdndar, la varianza o cualquier otra medida de la variabilidad se use como variable de respuesta. 

Para ilustrar estos conceptos, considere los datos de la tabla 3-12, los cuales se obtuvieron de un expe- 
rimento diseriado en una fundicidn de aluminio. El aluminio se produce combinando alumina con otros 
ingredientes en una celda de reaccidn y aplicando calor al hacer pasar una corriente el6ctrica a trav6s de 
la celda. La altimina se agrega de manera continua a la celda para mantener la proporcidn apropiada de la 
misma con respecto a los otros ingredientes. En este experimento se investigaron cuatro algoritmos para 
controlar la proporcidn. Las variables de respuesta estudiadas se relacionaron con el voltaje de la celda. 
Espedficamente, un sensor registra el voltaje de la celda varias veces cada segundo, produciendo miles de 
mediciones del voltaje durante cada corrida del experimento. Los ingenieros del proceso decidieron usar 
como variables de respuesta el voltaje promedio y la desviacidn est&ndar del voltaje de la celda (indicado 
entre par6ntesis) en la corrida experimental. El voltaje promedio es importante porque afecta la tempe- 
ratura de la celda, y la desviacidn est&ndar del voltaje (llamada "ruido del crisol” por los ingenieros del 
proceso) es importante porque afecta la eficiencia global de la celda. 

Se llev6 a cabo un an&lisis de varianza para determinar si los diferentes algoritmos para controlar la 
proporcidn afectan el voltaje promedio de la celda. Este revelo que el algoritmo para controlar la propor- 
ci6n no tuvo ningun efecto de localizacidn; es decir, al cambiar los algoritmos para controlar la propor- 
tion no hubo ningun cambio en el voltaje promedio de la celda. (Referirse al problema 3-28.) 

Para investigar los efectos de dispersidn, lo mejor suele ser utilizar 

log(s) o log(s 2 ) 

como variable de respuesta, ya que la transfonnacidn logaritmica es eficaz para estabilizar la variabilidad 
en la distribucidn de la desviacidn estdndar muestral. Puesto que todas las desviaciones est£ndar del vol- 
taje del crisol son menores que la unidad, se usar£ 

y=-ln(s) 

como la variable de respuesta. En la tabla 3-13 se presenta el an&lisis de varianza para esta respuesta, el 
logaritmo natural del “ruido del crisol”. Observe que la eleccidn de un algoritmo para controlar la pro- 
portion afecta el ruido del crisol; es decir, el algoritmo para controlar la proportion tiene un efecto de dis- 


Tabla 3-13 An&lisis de varianza del logaritmo natural del ruido del crisol 

Fuente de variaciOn 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

F o 

Valor P 

Algoritmo para controlar la proportion 

6.166 

3 

2.055 

21.96 

<0.001 

Error 

1.872 


0.094 



Tbtal 

8.038 

23 
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1 » 1 # + # 1 — 

2.00 3.00 4.00 


Ruido del crisol logarltmico promedio [-In ($)] 

Figura 3-16 Ruido del crisol logaritmico promedio [-ln($)J de 
cuatro algoritmos para controlar la proporcion en rela tion con u na 
d istribucid n t escalada con factor de escalamiento ^MS e / n ~ 
V0.094 / 6 = 0.125 


persidn. Las pruebas estlndares de la adecuacion del modelo, incluyendo las gr&ficas de probabilidad 
normal de los residuales, indican que no hay problemas con la validez del experimento. (Referirse al pro- 
blema 3-29.) 

En la figura 3-16 se grafica el logaritmo promedio del ruido del crisol de cada algoritmo para controlar 
la proporcidn y se presenta tambi6n una distribucidn t escalada que se usa como distribution de referencia 
para discriminar entre los algoritmos de la proporcidn. Esta grafica revela con toda claridad que el algorit- 
mo 3 para controlar la proporcidn produce m&s ruido del crisol o una desviacidn est£ndar del voltaje de la 
celda mayor que los otros algoritmos. No parece haber gran diferencia entre los algoritmos 1, 2 y 4. 


3-9 EL ENFOQUE DE REGRESI6N PARA EL ANALISIS DE VARIANZA 

Se ha ofrecido un desarrollo intuitivo o heuristico del analisis de varianza. Sin embargo, es posible pre- 
sentar un desarrollo m£s formal. El m6todo ser& de utilidad mis adelante para entender los fundamentos 
del analisis estadfstico de disenos mas complejos. Llamada la prueba general de significacion de la regre- 
sidn, el procedimiento consiste en esencia en encontrar la reduccion en la suma de cuadrados total para 
ajustar el modelo con todos los pardmetros incluidos y la reduccion en la suma de cuadrados cuando el 
modelo se restringe a la hipdtesis nula. La diferencia entre estas dos sumas de cuadrados es la suma de 
cuadrados de los tratamientos con la que puede realizarse la prueba de la hipdtesis nula. El procedimien- 
to requiere los estimadores de mfnimos cuadrados de los parametros en el modelo del analisis de varian- 
za. Se dieronya (en la seccidn 3-3.3) las estimaciones de estos parametros; sin embargo, ahora se presenta 
un desarrollo formal. 


3-9.1 Estimacidn de mfnimos cuadrados de los parametros del modelo 
Se desarrollan ahora los estimadores de los parametros en el modelo con un solo factor 

y*=M+ *i +E ii 

utilizando el metodo de mfn i m os cuadrados. Para encontrar los estimadores de mfnimos cuadrados de fi y 
r„ primero se forma la suma de cuadrados de los errores 

i-l j—l i=l j-l 


(3-51) 



3-9 EL ENFOQUE DE REGRESI6N PARA EL ANALISIS DE VARIANZA 113 


y se eligen despues los valores de/i y r„ por ejemplo p y i l , , que tninimi cen L . Los valores adecuados serian 
las soluciones de las a + 1 ecuaciones $imult£neas 


dL\ 

dfi 

dL 

dr. 


= 0 


= 0 1 = 1,2,..., a 


A1 derivar la ecuacidn 3-51 con respecto a n y r t y al igualar con cero se obtiene 

(y,-A-t ,)- o 


i=i j=i 


y 


n 


- 2 ^ (y*-P-ti)= 0 

/= i 

1 = 1, 2,. 

de la que, despuds de simplifies, se obtiene 


Nfi r ¥nt l +wt 2 + 

+ni a = y„ 

rc/z+ntj 


npi +nt 2 

= y i. 


(3-52) 


np +nt a = y a 

A las a + 1 ecuaciones (ecuacidn 3-52) con a + 1 incdgnitas se les llama las ecuaciones nonnales de 
mfnim os cuadrados. Observe que si se suman la ultimas a ecuaciones normales, se obtiene la primera 
ecuacidn normal. Por lo tanto, las ecuaciones nonnales no son linealmente independientes, y no existe una 
solucidn tinica para //, r„ ..., x a . Esta dificultad puede superarse mediante varios metodos. Puesto que los 
efectos de los tratamientos se han definido como desviaciones de la media global, parece razonable apli- 
car la restricckm 

2 f .=° ( 3 - 53 ) 

<=i 

Utilizando esta restricci6n, se obtiene como solucidn de las ecuaciones normales 

* = y. (3-54) 

= y L -y„ * = 1,2,..., a 

Evidentemente, esta soluci6n no es unica y depende de la restriccidn (ecuacidn 3-53) que se ha elegi- 
do. Al principio esto puede parecer desafortunado porque dos experimentadores diferentes podrian ana- 
lizar los mismos datos y obtener resultados diferentes si aplican restricciones diferentes. Sin embargo, 
ciertas funciones del parametro del modelo son estimadas de manera unica, independientemente de la 
restriccidn. Algunos ejemplos son r, - i), que se estimaria con T t — tj = y L - y ; ., y la media del tratamien- 
to l-6simo ft = n + T it que se estimaria con p t = p+i, = y,. . 

Puesto que el interes se encuentra generalmente en las diferencias entre los efectos de los tratamien- 
tos y no en sus valores reales, no produce preocupacibn alguna que r, no pueda estimarse de manera uni- 
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ca. En general, cualquier funcidn de los par&metros del modelo que sea una combinacidn lineal del 
miembro del lado izquierdo de las ecuaciones normales (ecuaciones 3-52) puede estimarse de manera 
unica. A las funciones que se estiman de manera unica independientemente de la restriccidn que se use se 
les llama funciones estimables. Para m&s information, ver el material suplementario del texto de este ca- 
pftulo. Nos encontramos listos para usar estas estimaciones de los parametros en un desarrollo general 
del andlisis de varianza. 


3*9.2 Prueba general de significacidn de la regresidn 

Una parte fundamental de este procedimiento es escribir las ecuaciones normales del modelo. Estas 
ecuaciones siempre podr&n obtenerse formando la funcion de mfnimos cuadrados y derMndola con res- 
pecto a cada pardmetro desconocido, como se hizo en la section 3-9.1. Sin embargo, se cuenta con un m6- 
todo m£s sencillo. Las reglas siguientes permiten escribir directamente las ecuaciones normales del 
modelo de cualquier diseno experimental: 

REGLA 1. Hay una ecuacion normal para cada parimetro del modelo que va a estimarse. 

REGLA 2. El miembro derecho de cualquier ecuackm normal es s61o la suma de todas las observa- 
ciones que contienen el par^metro asociado con esa ecuacidn normal particular. 

Para ilustrar esta regia, considere el modelo con un solo factor. La primera ecuacidn normal 
corresponde al pardmetro /u; por lo tanto, el miembro derecho esy.., ya que todas las observatio- 
ns incluyen a fi, 

REGLA 3. El miembro izquierdo de cualquier ecuacidn normal es la suma de todos los parametros 
del modelo, donde cada par&metro esta multiplicado por el numero de veces que aparece en el 
total del miembro derecho. Los parametros se escriben con un acento circunflejo (") para indicar 
que son estimadores y no los verdaderos valores de los parametros. 

Por ejemplo, considere la primera ecuaci6n normal en un experimento con un solo factor. De acuer- 
do con las reglas anteriores, 6sta seria 

Nfi+m 1 +ni 2 + — I- nr a = y 

por que ^ aparece enlasNobservaciones, s61o aparece en las n observaciones hechas bajo el primer tra- 
tamiento, r 2 aparece sdlo en las n observaciones tomadas bajo el segundo tratamiento, etc. Por la ecua- 
ti6n 3-52 se verifica que la ecuacion presentada arriba es correcta. La segunda ecuacion normal 
corresponderia a y es 


nju+ni 1 = y l 

porque s61o las observaciones del primer tratamiento contienen a t 1 (esto dayj como miembro derecho), 
H y aparecen exactamente n veces eny 1; y todas las demas r, aparecen cero veces. En general, el miem- 
bro izquierdo de cualquier ecuatidn normal es el valor esperado del miembro derecho. 

Ahorabien, considere encontrar la reduction en la suma de cuadrados ajustando un modelo particu- 
lar a los datos. Al ajustar un modelo a los datos se “explica” parte de la variabilidad; es decir, la variabili- 
dad no explicada se reduce en tierta cantidad. La reduccidn en la variabilidad no explicada es siempre la 
suma de las estimaciones de los parametros, cada una de ellas multiplicada por el segundo miembro de la 
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ecuaci6n normal que corresponde al parametro espedfico. Por ejemplo, en un experimento con un solo 
factor, la reduction debida al ajuste del modelo completo y v = n + r, + e v es 


R(l u, r)=fiy +V1. +t 2 yi. + - 

CT 

-Ay.. +2 i ‘ y '- 

i=l 


(3-55) 


La notation R(ji, r) significa la reducci6n en la suma de cuadrados a partir del ajuste del modelo que con- 
tiene apt y {r,}. A R(pi , r) se le llama en ocasiones la suma de cuadrados “de regresion” del modelo com- 
pleto y i} = pi + + Eij. El numero de grados de libertad asociado con una reduccidn en la suma de 

cuadrados, tal como R(pi 9 r), siempre es igual al ntimero de ecuationes normales linealmente indepen- 
dientes. El resto de la variabilidad no explicada por el modelo se encuentra con 

ss e = 2 2 >» - t ) ( 3 - 56 ) 

«=i M 

Esta cantidad se usa en el denominador del estadistico de prueba de H q :t x ~ r 2 = --- = r fl = 0. 

A continuacidn se ilustra la prueba general de significacidn de la regresidn para un experimento con 
un solo factor y se demuestra que produce el an£lisis de varianza de un solo factor comun. El modelo es 
y.j = fi + r, + e ij9 y las ecuationes normales se eneuentran con las reglas anteriores como 


Nft+ni j +nt 2 + • 

■■ +nt a = y 

rtfi+nt l 

= Vl 

nfi +ni 2 

= y 2. 

nfi 

= y a 


Compare estas ecuationes normales con las que se obtuvieron en la ecuacion 3-52. 

Al aplicar la restriccidn 2" =1 r 1 = 0, los estimadores de pi y r, son 

t i = y L -y. > i = i, 2,..., a 

La reduccidn en la suma de cuadrados debida al ajuste de este modelo completo se encuentra con la ecua- 
ci6n 3-55 como 


R(fi, r ) = fty +J t,y L 

i-1 


“OOx+X )>«. 

i-l 

= 77 + 2 y-.y -y-'Z y. 

i=i /-I 
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que tiene a grados de libertad porque hay a ecuaciones normales linealmente independientes. La suma de 
cuadrados del error es, por la ecuacidn 3-56, 


55 * = 22 ti-nt*,*) 

i = 1 7-1 

a n a 

=22 tf-2 


*■= i 


ZL 

n 


y tiene IV - a grados de libertad. 

Para encontrar la suma de cuadrados que resulta de los efectos de los tratamientos (el {r ; }), se consi- 
dera que el modelo se restringe a la hipdtesis nula; es decir, r, = 0 para toda i. El modelo reducido es y tj = 
H + %. Hay una sola ecuacidn normal para este modelo: 

W = y, 

y el estimador de/< es fi— y . Por lo tanto, la reduccion en la suma de cuadrados que resulta de ajustar el 
modelo reducido que s61o coutiene a fi es 

w-a Xx.)=4 


Puesto que hay una sola ecuacidn normal para este modelo reducido, R<ji) tiene un grado de libertad. La 
suma de cuadrados debida al {r,}, dado que// ya esta incluida en el modelo, es la diferencia entre R(/i, x) y 
R(fi), que es 

R(x\n)=R(n,t)-R(n) 

= 7?(Modelo Completo)- 7?(Modelo Reducido) 


con a - 1 grados de libertad, que por la ecuacidn 3-9 se identifica como SS^ Estableciendo el su- 

puesto de normalidad usual, el estadistico apropiado para probar H 0 : Tj = t 2 = = t a = 0 es 


7?(rl/i)/( fl -l) 


22 o 

L' =1 M 


/(iV-fl) 


que se distribuye como J F a _ 1 , Vwj bajo la hipotesis nula. Se trata, desde luego, del estadistico de prueba para 
el andlisis de varianza de un solo factor. 


3-10 METODOS NO PARAMETRICOS EN EL ANALISIS DE VARIANZA 
3-10.1 La prueba de Kruskal-Wallis 

En situaciones en las que el supuesto de normalidad no est& justificado, el experimentador quiza quiera 
usar un procedimiento altemativo del analisis de varianza con la prueba F que no dependa de este su- 
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puesto. Kruskal y Wallis [68] han desarrollado este procedimiento. La prueba de Kruskal-Wallis se usa 
para probar la hip6tesis nula de que los a tratamientos son identicos contra la hipdtesis alternativa de que 
algunos de los tratamientos generan observaciones que son mayores que otras. Debido a que el procedi- 
miento est£ disenado para ser sensible al probar las diferencias en las medias, en ocasiones es conveniente 
considerar la prueba de Kruskal-Wallis como una prueba de la igualdad de las medias de los tratamientos. 
La prueba de Kruskal-Wallis es una alternativa no parametrica del analisis de varianza usual. 

Para realizar la prueba de Kruskal-Wallis, primero se hace la clasificacion en rangos de lasy, y observa- 
ciones en orden ascendente y cada observacidn se reemplaza con su rango, por ejemplo R, P asignandole a 
la observacidn menor el rango 1. En el caso de empates (observaciones que tienen el mismo valor), se 
asigna el rango promedio a cada una de las observaciones empatadas. Sea R L la suma de los rangos del tra- 
tamiento i-esimo. El estadistico de prueba es 



Rf N(N+l) 2 
», 4 


(3-57) 


donde n, es el numero de observaciones del tratamiento i-esimo, TV es el numero total de observaciones y 


S 2 


1 

TV- 1 


_a n i 

21*t- 


M j = 1 


N(N+l) 2 

4 


(3-58) 


Observe que S 2 es s61o la varianza de los rangos. Si no hay empates, S 2 = N(N + 1)/12, y el estadistico de 
prueba se simplifica a 


12 

“TV(TV+1)£ 



3(TV+1) 


(3-59) 


Cuando el numero de empates es moderado, habra pequenas diferencias entre las ecuaciones 3-57 y 3-59, 
y puede usarse la forma m&s simple (ecuacion 3-59). Si las n, son razonablemente grandes, por ejemplo 
n t > 5, H se distribuye aproximadamente como bajo la hipdtesis nula. Por lo tanto, si 

la hipdtesis nula se rechaza. Tambidn podria usarse el enfoque del valor R 


EJEMPLO 3-12 

En la tabla 3-14 se muestran los datos del ejemplo 3-1 y sus rangos correspondientes. Puesto que hay un 
numero bastante grande de empates, la ecuacion 3-57 se usa como el estadistico de prueba. Por la ecua- 
ci6n 3-58 se encuentra 


S 2 = 


TV-1 


24 


22 * 1 - 

L<=i M 

25(26) 2 


TV(TV+1) 2 


5497.79- 


= 53.03 
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Tabla 3-14 Datos y ranges para el experimento de la resistencia a la tensi6n del ejemplo 3-1 


Peso porcentual del algod6n 

15 

20 

25 

30 

35 

yji ... 

R v 

y-a 

X* 

y* 

X* 

y 4 / 

R Aj 

y% 

R sj 

7 

2.0 

12 

9.5 

14 

11.0 

19 

20.5 

1 

2.0 

7 

2.0 

17 

14.0 

18 

16.5 

25 

25.0 

10 

5.0 

15 

12.5 

12 

9.5 

18 

16.5 

22 

23,0 

11 

7.0 

11 

7.0 

18 

16.5 

19 

20.5 

19 

20.5 

15 

12,5 

9 

4.0 

18 

16,5 

19 

20.5 

23 

24.0 

11 

7.0 

R, 

27.5 


66.0 


85.0 


113.0 


33.5 


y el estadfstico de prueba es 




2 ? 


Ri NjN+lf 


1 


53.03 
= 19.25 


5245.0- 


4 

25(26) 2 


Puesto que H>% 0.01,4 > 4 = 13.28, se rechazaria la hipotesis nula y se concluiria que los tratamientos difie- 
ren. (El valor P para H — 19.25 es P = 0.0002.) Se trata de la misma conclusion obtenida por el analisis de 
varianza usual con la praeba F. 


3-10.2 Comentarios generates sobre la transformacion de rangos 

A1 procedimiento utilizado en la seccidn anterior de reemplazar las observaciones con sus rangos se le lla- 
ma la transformacidn de rangos. Es una tecnica muy poderosa y util. Si se aplicara la prueba F comun a 
los rangos en lugar de a los datos originates, se obtendria 


Htja- 1) 

(N~l~H)/(N-a) 


(3-60) 


como el estadistico de prueba (ver Conover [20], p. 337). Observe que cuando el estadistico H de Krus- 
kal-Wallis se incrementa o decrementa, F 0 tambien se incrementa 0 decrementa, por lo que la prueba de 
Kruskal-Wallis es equivalente a aplicar el analisis de varianza comun a los rangos. 

La transformacion de rangos tiene una amplia aplicabilidad en los problemas de diseno experimental 
para los que no existe ninguna altemativa no parametrica para el analisis de varianza. Esto incluye mu- 
chos de los disenos de capitulos subsecuentes de este libro. Si los datos estan en rangos y se aplica la prue- 
ba F comun, el resultado es un procedimiento aproximado que tiene buenas propiedades estadisticas (ver 
Conover e Iman [30a, b]). Cuando existe preocupacion acerca del supuesto de normalidad 0 por el efecto 
de puntos atipicos o valores “absurdos”, se recomienda que el analisis de varianza comun se realice tanto 
en los datos originales como en los rangos. Cuando ambos procedimientos producen resultados similares, 
probablemente los supuestos del analisis de varianza se satisfacen razonablemente, y el analisis estandar 
es satisfactory. Cuando los dos procedimientos difieren, debera darse preferencia a la transformacion de 
rangos, ya que es menos posible que sea distorsionada por una condition de no normalidad o la presencia 
de observaciones inusuales. En tales casos, tal vez el experimentador quiera investigar el uso de transfer- 
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maciones para la falta de normalidad y examinar los datos y el procedimiento experimental a fin de deter- 
minar si hay puntos atipicos y por qu 6 han ocurrido. 


3-11 PROBLEMAS 


3-1. Se estudia la resistencia a la tensidn del cemento portland. Pueden usarse econdmicamente cuatro diferentes 
tdcnicas de mezclado. Se han colectado los siguientes datos: 


Tecnica de mezclado 


Resistencia a la tensidn (lb/pulg 2 ) 


1 

3129 

3000 

2865 

2890 

2 

3200 

3300 

2975 

3150 

3 

2800 

2900 

2985 

3050 

4 

2600 

2700 

2600 

2765 


a) Probar la hipdtesis de que las tdcnicas de mezclado afectan la resistencia del cemento. Utilizar a = 0,05. 

b ) Construir una representacidn grdfica como se describid en la seccidn 3-5.3 para comparar las resistencias 
a la tensidn promedio de las cuatro tdcnicas de mezclado. LA qu6 conclusiones se llega? 

c) Usar el mdtodo LSD de Fisher con a - 0.05 para hacer comparaciones entre pares de medias. 

d) Construir una gr&fica de probabilidad normal de los residuales. ^Qud conclusiones se sacarian acerca de 
la validez del supuesto de normalidad? 

e ) Graficar los residuales contra la resistencia a la tensidn predicha. Comentar la gr&fica. 

f) Hacer un diagrama de dispersidn de los resultados como ayuda para la interpretacidn de los resultados 
de este experimento. 

3-2. a) Resolver de nuevo el inciso b del problema 3-1 utilizando la prueba del rango multiple de Duncan con a 
= 0.05. £Hay alguna diferencia en las conclusiones? 

b) Resolver de nuevo el inciso b del problema 3-1 utilizando la prueba de TUkey con a - 0.05, cSe llega a las 
mismas conclusiones con la prueba de TUkey que las obtenidas con el procedimiento gr£fico y/o con la 
prueba del rango multiple de Duncan? 

c) Explicar la diferencia entre los procedimientos de Duncan y de TUkey. 

3-3. Considere nuevamente el problema 3-1. Encontrar un intervalo de confianza de 95% para la resistencia a la 
tensidn media del cemento portland que produce cada una de las cuatro tecnicas de mezclado. Encontrar 
tambidn un intervalo de confianza de 95% para la diferencia en las medias de las tdcnicas 1 y 3. 6Sirve esto de 
ayuda para interpretar los resultados del experimento? 

3-4. Se llevo a cabo un experimento a fin de determinar si cuatro temperaturas de coccion especificas afectan la 
densidad de cierto tipo de ladrillo, El experimento produjo los siguientes datos: 


Temperatura 



Densidad 



100 

21.8 

21.9 

21.7 

21.6 

21.7 

125 

21.7 

21.4 

21.5 

21,4 


150 

21.9 

21.8 

21.8 

21.6 

21.5 

175 

21.9 

21.7 

21.8 

21.4 



a) 6La temperatura de coccidn afecta la densidad de los ladrillos? Utilizar a = 0.05. 

b) £Es apropiado comparar las medias utilizando la prueba del rango multiple de Duncan (por ejemplo) en 
este experimento? 

c) Analizar los residuales de este experimento. 6Se satisfacen los supuestos del andlisis de varianza? 

d) Construir una representacidn gr&fica de los tratamientos como se describid en la seccidn 3-5.3. ^Esta 
gr&fica resume adecuadamente los resultados del andlisis de varianza del inciso al 
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3-5. Resolver de nuevo el inciso d del problema 3-4 utilizando el m6todo LSD de Fisher. 6A qu6 conclusiones se 
Ilega? Explicar en detalle c6mo se modified la tecnica para tomar en cuenta los tamaiios de las muestras desi- 
guales. 

3-6. Un fabricante de televisores est£ interesado en el efecto de cuatro tipos diferentes de recubrimientos para cines- 
copios de color sobre la conductividad de un cinescopio. Se obtienen los siguientes datos de la conductividad: 


Tipo de recubrimlento Conductividad 


1 

143 

141 

150 

146 

2 

152 

149 

137 

143 

3 

134 

136 

132 

127 

4 

129 

127 

132 

129 


a) £Hay alguna diferencia en la conductividad debida al tipo de recubrimiento? Utilizar a = 0.05. 

b) Estimar la media global y los efectos de los tratamientos. 

c) Calcular la estimacidn de un intervalo de confianza de 95% para la media del tipo de recubrimiento 4. 
Calcular la estimacidn de un intervalo de confianza de 99% para la diferencia media entre los tipos de re- 
cubrimiento 1 y 4. 

d) Probar todos los pares de medias utilizando el mdtodo LSD de Fisher con a = 0.05. 

e) Usar el mdtodo gr&fico comentado en la seccidn 3-5.3 para comparar las medias. £Cu£l es el tipo de recu- 
brimiento que produce la conductividad m£s alta? 

f) Suponiendo que el recubrimiento tipo 4 es el que se estd usando actualmente, iqu6 se recomendaria al 
fabricante? Quiere minimizarse la conductividad. 

3-7. Considere nuevamente el experimento del problema 3-6. Analizar los residuales y sacar conclusiones acerca 
de la adecuacidn del modelo, 

3-8. En un articulo deACI Materials Journal (vol. 84, pp. 213-216) se describen varios experimentos para investi- 
gar el varillado del concreto para eliminar el aire atrapado. Se usd un cilindro de 3 x 6 pulgadas; y el numero 
de veces que esta barra se utilizd es la variable del diseno. La resistencia a la compresidn resultante de la 
muestra de concreto es la respuesta. Los datos se muestran en la tabla siguiente: 


Nivel de varillado 


Resistencia a la compresidn 


10 

1530 

1530 

1440 

15 

1610 

1650 

1500 

20 

1560 

1730 

1530 

25 

1500 

1490 

1510 


a) 6 Hay alguna diferencia en la resistencia a la compresidn debida al nivel de varillado? Utilizar a = 0.05. 

b ) Encontrar el valor P para el estadistico F del inciso a. 

c) Analizar los residuales de este experimento. 6 Que conclusiones pueden sacarse acerca de los supuestos 
fundamentals del modelo? 

d) Construir una representacidn grdfica para comparar las medias de los tratamientos, como se describid 
en la seccidn 3-5.3. 

3-9. En un articulo de Environment International (vol. 18, no. 4) se describe un experimento en el que se investigo 
la cantidad de raddn liberado en las duchas. Se usd agua enriquecida con raddn en el experimento, y se pro- 
baron seis di£metros diferentes de los orificios de las regaderas. Los datos del experimento se muestran en la 
siguiente tabla: 
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Di&metro de 

los orificios Raddn liberado (%) 


0.37 

80 

83 

83 

85 

0.51 

75 

75 

79 

79 

0.71 

74 

73 

76 

77 

1.02 

67 

72 

74 

74 

1.40 

62 

62 

67 

69 

1.99 

60 

61 

64 

66 


a) LEI tamano de los orificios afecta el porcentaje promedio del raddn liberado? Utilizar a - 0*05. 

b) Encontrar el valor P para el estadfstico F del inciso a . 

c) Analizar los residuales de este experimento. 

d) Encontrar un intervalo de confianza de 95% para el porcentaje promedio de raddn liberado cuando el 
di&metro de los orificios es 1.40. 

e ) Construir una representacidn grdfica para comparar las medias de los tratamientos, como se describio 
en la seccidn 3-5.3. 6Que conclusiones pueden sacarse? 

3-10. Se determind el tiempo de respuesta en milisegundos para tres diferentes tipos de circuitos que po- 
drlan usarse en un mecanismo de desconexidn automdtica. Los resultados se muestran en la siguiente 
tabla: 


Tipo de circuito 


Tiempo de respuesta 


1 

9 

12 

10 

8 

15 

2 

20 

21 

23 

17 

30 

3 

6 

5 

8 

16 

7 


a) Probar la hipdtesis de que los tres tipos de circuitos tienen el mismo tiempo de respuesta. Utilizar 

a = 0.01. 

b ) Usar la prueba de l\ikey para comparar pares de medias de los tratamientos. Utilizar a - 0.01. 

c) Usar el procedimiento grdfico de la seccidn 3-5.3 para comparar las medias de los tratamientos, £Qud 
conclusiones pueden sacarse? 6C6mo se comparan con las conclusiones del inciso b? 

d ) Construir un conjunto de contrastes ortogonales, suponiendo que al principio del experimento se sospe- 
chaba que el tiempo de respuesta del circuito tipo 2 era diferente del de los otros dos. 

e) Si el lector fuera el ingeniero de diseno y quisiera minimizar el tiempo de respuesta, Lqu6 tipo de circuito 
seleccionaria? 

f) Analizar los residuales de este experimento. £Se satisfacen los supuestos del analisis de varianza b&- 
sico? 

3-11. Se estudia la vida efectiva de los fhiidos aislantes en una carga acelerada de 35 kV. Se han obtenido datos de 

una prueba para cuatro tipos de fluidos. Los resultados fueron los siguientes: 


Tipo de fluido Vida (en horas) con 35 kV de carga 


1 

17.6 

18.9 

16.3 

17.4 

20.1 

21.6 

2 

16.9 

15.3 

18.6 

17.1 

19.5 

20.3 

3 

21.4 

23.6 

19.4 

18.5 

20.5 

22.3 

4 

19.3 

21.1 

16.9 

17.5 

18.3 

19.8 
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a) 6Hay algtin indicio de que los fluidos difieran? Utilizar a = 0.05. 

b) ICuil fluido seleccionaria el lector, dado que el objetivo es conseguir la vida efectiva m&s larga? 

c) Analizar los residuales de este experimento. LSe satisfacen los supuestos del an&lisis de varianza bdsico? 
3-12. Se estudian cuatro diferentes tipos de disefios de un circuito digital de computadora para comparar la canti- 

dad de ruido presente. Se obtienen los siguientes datos: 


Diseno del circuito Ruido observado 


1 

19 

20 

19 

30 

8 

2 

80 

61 

73 

56 

80 

3 

47 

26 

25 

35 

50 

4 

95 

46 

83 

78 

97 


a) LLa. cantidad de ruido presente es la misma para los cuatro disenos? Utilizar a = 0.05. 

b) Analizar los residuales de este experimento. iSe satisfacen los supuestos del an&lisis de varianza? 

c) LQ\x6 diseno del circuito se seleccionarfa para usarlo? El ruido bajo es mejor. 

3-13. Se pide a cuatro qufmicos que determinen el porcentaje de alcohol metflico en cierto compuesto quimico. 
Cada quimico hace tres determinaciones, y los resultados son los siguientes: 


Quimico Porcentaje de alcohol metflico 


1 

84.99 

84.04 

84.38 

2 

85.15 

85.13 

84.88 

3 

84.72 

84.48 

85.16 

4 

84.20 

84.10 

84.55 


a) 6 Los quimicos difieren significativamente? Utilizar a = 0.05. 

b) Analizar los residuales de este experimento. 

c) Si el quimico 2 es un empleado nuevo, construir un conjunto razonable de contrastes ortogonales que 
podria haberse usado al principio del experimento. 

3-14. Se someten a estudio tres marcas de baterias. Se sospecha que las vidas (en semanas) de las tres marcas son 
diferentes. Se prueban cinco baterias de cada marca con los resultados siguientes: 


Semanas de vida 

Marca 1 

Marca 2 

Marca 3 

100 

76 

108 

96 

80 

100 

92 

75 

96 

96 

84 

98 

92 

82 

100 


a) 6Las vidas de estas tres marcas son diferentes? 

b ) Analizar los residuales de este experimento. 

c) Construir la estimaci6n de un intervalo de confianza de 95% para la vida media de la bateria marca 2. 
Construir la estimacidn del intervalo de confianza de 99% para la diferencia media entre las vidas de las 
baterias marcas 2 y 3. 
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d) 6Qu 6 marca seleccionaria el lector para usarla? Si el fabricante reemplazara sin cargo cualquier bateria 
que dure menos de 85 semanas, £qu6 porcentaje esperaria reemplazar la compania? 

3-15. Se est&n investigando cuatro catalizadores que pueden afectar la concentration de un componente en una 
mezcla liquida de tres componentes. Se obtienen las siguientes concentraciones: 


Catalizador 

1 

2 

3 

4 

58.2 

56.3 

50.1 

52,9 

57.2 

54.5 

54,2 

49.9 

58.4 

57.0 

55.4 

50.0 

55.8 

55.3 


51.7 

54.9 





a) £Los cuatro catalizadores tienen el mismo efecto sobre la concentracidn? 

b) Analizar los residuales de este experimento, 

c) Construir la estimation de un intervalo de confianza de 99% para la respuesta media del catalizador 1 . 
3*16. Se llevd a cabo un experimento para investigar la eficacia de cinco materiales aislantes. Se probaron cuatro 

muestras de cada material con un nivel elevado de voltaje para acelerar el tiempo de falla. Los tiempos de fa- 
Ua (en minutos) se muestran abajo: 


Material 


Tiempo de falla (minutos) 


1 

110 

157 

194 

178 

2 

1 

2 

4 

18 

3 

880 

1256 

5276 

4355 

4 

495 

7040 

5307 

10,050 

5 

7 

5 

29 

2 


a) 6 Los cinco materiales tienen el mismo efecto sobre el tiempo de falla? 

b) Graficar los residuales contra la respuesta predicha. Construir una gr&fica de probabilidad normal de los 
residuales. LQu& information transmiten estas grdficas? 

c ) Con base en la respuesta del intiso b , realizar otro an£lisis de los datos del tiempo de falla y sacar las con- 
clusions apropiadas. 

3-17. Un fabricante de semiconductors ha desarrollado tres m6todos diferentes para reducir el conteo de particu- 
las en las obleas, Los tres mOtodos se prueban en cinco obleas y se obtiene el conteo de particulas despu^s del 
tratamiento. Los datos se muestran abajo: 


Metodo 



Conteo 



1 

31 

10 

21 

4 

i 

2 

62 

40 

24 

30 

35 

3 

53 

27 

120 

97 

68 


a) £Todos los mOtodos tienen el mismo efecto sobre el conteo promedio de particulas? 

b) Graficar los residuales contra la respuesta predicha. Construir una gr&fica de probabilidad normal de los 
residuales. £Hay motivo de preocupaci6n potential acerca de la validez de los supuestos? 

c) Con base en la respuesta del intiso b, realizar otro an£lisis de los datos del conteo de particulas y sacar las 
conclusiones apropiadas. 
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3-18. Considere la prueba de la igualdad de las medias de dos poblaciones normales, donde las varianzas son des* 
conocidas pero se suponen iguales. El procedimiento de prueba apropiado es la prueba t agrupada o combi- 
nada. Demostrar que la prueba t combinada es equivalente al andlisis de varianza de un solo factor. 
3-19. Demostrar que la varianza de la combination lineal 2J =1 c^ ( - es 

3-20. En un experimento con efectos fijos, suponga que hay n observaciones para cada uno de cuatro tratamientos. 
Sean (£ los componentes con un solo grado de libertad de los contrastes ortogonales. Demostrar que 

•^■natamientos = Gf + 0z + Q$‘ 

3-21. Utilizar la prueba de Bartlett para determinar si el supuesto de la igualdad de las varianzas se satisface en el 
problema 344. Utilizar a = 0.05. £Se llegO a la misma conclusion respecto de la igualdad de las varianzas con 
el examen de las grdficas de los residuales? 

3-22. Utilizar la prueba de Levene modificada para determinar si el supuesto de las varianzas iguales se satisface 
en el problema 3-14. Utilizar a = 0.05. L$t llegO a la misma conclusion respecto de la igualdad de las varian- 
zas con el examen de las grdficas de los residuales? 

3-23. Referirse al problema 3-10. Si quiere detectarse una diferencia maxima en los tiempos de respuesta prome- 
dio de 10 milisegundos con una probabilidad de al menos 0.90, 6qu0 tamano de la muestra deberd usarse? 
6C0mo se obtendria una estimaciOn preliminar de a 2 l 
3-24, Referirse al problema 3-14. 

a ) Si quiere detectarse una diferencia maxima en la vida de las baterias de 10 horas con una probabilidad de 
al menos 0.90, £qu6 tamano de la muestra deberd usarse? Comentar c6mo se obtendria una estimaciOn 
preliminar de a 1 para responder esta pregunta, 

b) Si la diferencia entre las marcas es lo suficientemente grande para que la desviaciOn estdndar de una ob- 
servation se incremente en 25%, Lqu6 tamano de la muestra deberd usarse si quiere detectarse esto con 
una probabilidad de al menos 0.90? 

3-25. Considere el experimento del problema 3-14, Si quiere construirse un intervalo de confianza de 95% para la 
diferencia en las vidas medias de dos baterias que tenga una precision de ±2 semanas, 6cudnta$ baterias de 
cada marca deben probarse? 

3-26. Suponga que cuatro poblaciones normales tienen medias = 50, = 60, = 50y fi 4 = 60. L Cudntas obser- 

vaciones deberdn hacerse en cada poblaciOn para que la probabilidad de rechazar la hipOtesis nula de la 
igualdad de las medias poblacionales sea al menos 0.90? Suponer que a = 0.05 y que una estimaciOn razona- 
ble de la varianza de error es o 2 = 25. 

3-27. Referirse al problema 3-26. 

a) 6En quO forma cambiaria la respuesta si una estimaciOn razonable de la varianza del error experimental 
fuera a 2 = 36? 

b) LEn qu6 forma cambiaria la respuesta si una estimaciOn razonable de la varianza del error experimental 
fuera a 2 = 49? 

c ) £Puede sacarse alguna conclusion acerca de la sensibilidad de la respuesta dada en esta situation 
particular acerca de cOmo afecta la estimaciOn deer la decision referente al tamano de la muestra? 

d) 6Puede hacerse alguna recomendaciOn acerca de cOmo deberia usarse este enfoque general para elegir n 
en la pr&ctica? 

3-28, Referirse al experimento de la fundiciOn de aluminio descrito en la secciOn 3-8. Verificar que los mdtodos 
para controlar la proportion de alumina no afectan el voltaje promedio de la celda. Construir una grdfica de 
probabilidad normal de los residuales, Graficar los residuales contra los valores predichos. ^Existe algun in- 
dicio de que se violan algunos de los supuestos fundamentales? 

3-29. Referirse al experimento de la fundiciOn de aluminio de la secciOn 3-8. Verificar el an£lisis de varianza del 
ruido del crisol que se resume en la tabla 343. Examinar las grdficas de los residuales usuales y comentar la 
validez del experimento. 

3*30. Se investigaron cuatro diferentes velocidades de alimentaciOn en un experimento con una mdquina CNC que 
produce una pieza que se usa en la unidad de potencia auxiliar de un aviOn. El ingeniero de manufactura a 
cargo del experimento sabe que una dimension crftica de la pieza de interOs puede ser afectada por la veloci- 
dad de alimentaciOn. Sin embargo, la experiencia previa indica que es probable que sOlo est6n presentes 
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efectos de dispersidn. Es decir, al cambiarse la velocidad de alimentacidn no se afecta la dimensidn prome- 
dio , pero podrfa afectarse la variabilidad dimensional* El ingeniero realiza cinco corridas de produccidn con 
cada velocidad de alimentacidn y obtiene la desviacidn estdndar de la dimensidn critica (en KH mm). Los da- 
tes se muestran abajo. Suponer que todas las corridas se hicieron en orden aleatorio. 


Velocidad de alimentaciOn 
(pulgadas/minuto) 


Corrida de production 


1 

2 

3 

4 

5 

10 

0*09 

0.10 

0.13 

0.08 

0.07 

12 

0.06 

0.09 

0*12 

0.07 

0.12 

14 

0.11 

0.08 

0.08 

0.05 

0.06 

16 

0.19 

0.13 

0*15 

0.20 

0.11 


a) £La velocidad de alimentation tiene algiin efecto sobre la desviacidn estdndar de esta dimension critica? 

b) Usar los residuales de este experimento para investigar la adecuacidn del modelo. 6Hay algiin problema 
con la validez experimental? 

3-31. Considere los datos del problema 3-10, 

a) Escribir las ecuaciones normales de minimos cuadrados para este problema y resolverlas para p y f . , uti- 
lizando la restriction usual = 0) Estimar - r 2 . 

b) Resolver las ecuaciones del inciso a utilizando la restriction r 3 - 0. 6Los estimadores r, yfi son los mis- 
mos que se encontraron en el inciso a ? 6Por qu6? Estimar ahora r l -T 2 y comparar la respuesta con la del 
inciso a * £Qu6 afirmaciOn puede hacerse respecto de estimar los contrastes en las r,? 

c) Estimar p + r t , 2tj - r 2 - r 3J y p + r l + r 2 utilizando las dos soluciones de las ecuaciones normales. Com- 
parar los resultados obtenidos en cada caso* 

3-32. Aplicar la prueba general de signification de la regresiOn en el experimento del ejemplo 34. Demostrar que 
el procedimiento produce los mismos resultados que el an&lisis de varianza usual. 

3-33. Usar la prueba de Kruskal-Wallis en el experimento del problema 3-11. Comparar las conclusiones obtenidas 
con las del an&lisis de varianza usual. 

3-34* Usar la prueba de Kruskal-Wallis en el experimento del problema 3-12. £Los resultados son comparables con 
los encontrados por el an&lisis de varianza usual? 

3-35. Considere el experimento del ejemplo 3-1. Suponga que la observation mayor de la resistencia a la tension se 
registrO incorrectamente como 50. iQu6 efecto tiene esto sobre el an£lisis de varianza usual? LQu& efecto 
tiene sobre la prueba de Kruskal-Wallis? 




Bloques aleatorizados, 
cuadrados latinos y disenos 
relacionados 


4-1 DISENO DE BLOQUES COMPLETOS ALEATORIZADOS 

En cualquier experimento, la variabilidad que surge de un factor perturbador puede afectar los resulta- 
dos. En general, un factor perturbador puede definirse como un factor del diseiio que probablemente 
tenga un efecto sobre la respuesta, pero en el que no existe un interns especifico. En ocasiones un factor 
perturbador es desconocido y no controlable; es decir, se desconoce la existencia de ese factor e incluso 
puede tener niveles variables mientras se est& realizando el experimento. La aleatorizaci6n es la tecnica 
de diseno que se utiliza para protegerse contra estos factores perturbadores “que est&n al acecho”. En 
otros casos, el factor perturbador es conocido pero no controlable. Si por lo menos puede observarse el 
valor que asume el factor perturbador en cada corrida del experimento, es posible hacer la compensation 
correspondiente en el anidisis estadistico mediante el uso del analisis de covarianza, una tecnica que se 
revisarii en el capitulo 14. Cuando la fuente de variabilidad perturbadora es conocida y controlable, pue- 
de usarse una tecnica de diseno llamada formation de bloques para eliminar de manera sistematica su 
efecto sobre las comparaciones estadisticas entre los tratamientos. La formation de bloques es una tuni- 
ca de diseno en extremo importante que se utiliza ampliamente en la experimentation industrial, y es la 
materia de este capitulo. 

Para ilustrar la idea general, suponga que quiere determinarse si cuatro puntas diferentes producen o 
no lecturas diferentes en una maquina para probar la dureza. Un experimento como 6ste podria ser parte 
de un estudio de la aptitud en la calibration de los instrumentos. La maquina funciona presionando la 
punta en un ejemplar de prueba de metal, y por la profundidad de la depresion resultante puede determi- 
narse la dureza del ejemplar. El experimentador ha decidido obtener cuatro observaciones para cada 
punta. Hay un solo factor —el tipo de punta—, y un diseno completamente aleatorizado de un solo factor 
consistiria en asignar al azar cada una de las 4 x 4 = 16 corridas a una unidad experimental, es decir, a un 
ejemplar de prueba de metal, y observar que resulta de la lectura de la dureza. Por lo tanto, se necesita- 
rian 16 ejemplares de prueba de metal en este experimento, uno por cada corrida del diseno. 

Existe un problema potencialmerte serio con un experimento por completo aleatorizado en esta si- 
tuation de diseno. Si los ejemplares de prueba de metal difieren ligeramente en sus durezas, como podria 
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Tabla 4-1 Diseno de bloques completos aleatorizados para el 
experimento de la prueba de la dureza 


Tipo de punta 


Ejemplar de prueba 


1 

2 

3 

4 

1 

9.3 

9.4 

9,6 

10,0 

2 

9.4 

9,3 

9.8 

9.9 

3 

9.2 

9.4 

9.5 

9.7 

4 

9.7 

9.6 

10.0 

10.2 


ocurrir si se tomaran de lingotes que se produjeron con temperaturas diferentes, las unidades experimen- 
tales (los ejemplares de prueba) contribuir&n a la variabilidad observada en los datos de la dureza, Como 
resultado, el error experimental reflejara tanto el error aleatorio como la variabilidad entre los ejempla- 
res de prueba, 

El objetivo seria hacer el error experimental tan pequeno como fuera posible; es decir, querria elimi- 
narse del error experimental la variabilidad entre los ejemplares de prueba. Un diseno para lograr esto 
requiere que el experimentador pruebe cada punta una vez en cada uno de los cuatro ejemplares de prue- 
ba, A este diseno, que se muestra en la tabla 4-1, se le llama diseno de bloques completos aleatorizados 
(RCBD, randomized complete block design). La respuesta observada es la dureza en la escala C de Rockwell 
menos 40. La palabra “completos” indica que cada bloque (ejemplar de prueba) contiene todos los tratamien- 
tos (puntas). A1 utilizar este diseno, los bloques o ejemplares de prueba forman una unidad experimental 
m&s homog6nea en la cual comparar las puntas. De hecho, esta estrategia de diseno mejora la precision 
de las comparaciones entre las puntas al eliminar la variabilidad entre los ejemplares de prueba. Dentro de 
un bloque, el orden en que se prueban las cuatro puntas se determina aleatoriamente. Observe la simili- 
tud de este problema de diseno con el de la seccidn 2-5, donde $e analizd la prueba t pareada. El diseno de 
bloques completos aleatorizados es una generalization de ese concepto. 

El RCBD es uno de los disenos experimentales m&s utilizados. Son numerosas las situaciones en las 
que el RCBD es apropiado. Las unidades de equipo o maquinaria de prueba son con frecuencia diferen- 
tes en sus caracteristicas de operacidn y serian un factor de formation de bloques tfpico. Lotes de materia 
prima, personas y el tiempo tambidn son fuentes de variabilidad perturbadora comunes en un experimen- 
to que pueden controlarse de manera sistematica mediante la formacidn de bloques. 

La formacion de bloques tambien puede ser util en situaciones que no incluyen necesariamente fac- 
tores perturbadores. Por ejemplo, suponga que un ingeniero quimico est£ interesado en el efecto de la ve- 
locidad de alimentacidn del catalizador sobre la viscosidad de un polimero, Sabe que hay varios factores, 
como la fuente de la materia prima, la temperatura, el operador y la pureza de la materia prima, que son 
muy dificiles de controlar en proceso en gran escala. Por lo tanto, decide probar en bloques la velocidad 
de alimentation del catalizador, donde cada bloque consiste en alguna combinacidn de estos factores no 
controlables. De hecho, esta utilizando los bloques para probar la robustez de su variable de proceso (la 
velocidad de alimentacion) para las condiciones que no puede controlar con facilidad. Para un an£lisis 
mds amplio de este punto, ver Coleman y Montgomery [27]. 


4-1.1 Andlisis estadistico del diseno de bloques completos aleatorizados 

Suponga que se tienen, en general, a tratamientos que van a compararse y b bloques. El diseno de bloques 
completos aleatorizados se muestra en la figura 4-1. Hay una observacidn por tratamiento en cada blo- 
que, y el orden en que se corren los tratamientos dentro de cada bloque se determina al azar. Debido a 
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Bloque 1 Bloque 2 Bloque b 


>il 


>12 


>11, 

>21 


>22 


>26 



>32 

■ * * 

>36 

# 


# 


. 

y a i 


y a a 


>06 


Figura 4-1 £1 diseno de bloques completos aleatorizados. 


que la unica aleatorizaci6n de los tratamientos se hace dentro de los bloques, con frecuencia se dice que 
los bloques representan una restriction sobre la aleatorizaciOn. 

El modelo estadfstico del RCBD puede escribirse de varias maneras. El tradicional es el modelo de 
los efectos: 


* 


= fi+r i+Pj+e v 


i « 1, 2,..., a 


(4-1) 


donde fi es la media global, r, es el efecto del tratamiento I-esimo, /?, es el efecto del bloque )-6simo, y i'„ es 
el termino del error NID(0, o 2 ) usual. Se considerar& inicialmente que los tratamientos y los bloques son 
factores fijos. Como en el modelo del diseno experimental con un solo factor del capftulo 3, el modelo de 
los efectos para el RCBD es un modelo sobreespecificado. En consecuencia, los efectos de los tratamien- 
tos y los bloques se consideran por lo general como desviaciones de la media global, por lo que 


2 

i-l 




= 0 y 2>,=0 


/= 1 


ThmbiOn es posible usar un modelo de las medias para el RCBD, por ejemplo 




U = 1, 2,..., a 


donde/t,, =fi + r, + Sin embargo, en este capftulo se usari el modelo de los efectos de la ecuacion 4-1. 

En un experimento en el que se use el RCBD, el interns se encuentra en probar la igualdad de las me- 
dias de los tratamientos. Por lo tanto, las hipdtesis de interns son 

H a :p x = n 2 = ■■■ = n a 
ifjtal menos una // . ^ jUj 

Puesto que la media del tratamiento i-dsimo es/t, = (1/6)2 J =1 (it + r, + ftj) =fi +r„ una manera equivalen- 
te de escribir las hipdtesis anteriores es en tdrminos de los efectos de los tratamientos, por ejemplo 

H 0 :t x = r 2 = ••• = r a = 0 
H l :r i * 0 para al menos una i 

Seay,, el total de observaciones hechas bajo el tratamiento /,y y el total de observaciones del bloque j,y 
el gran total de las observaciones y N = abe 1 numero total de observaciones. Expresado matemAticamente, 
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b 


2 y# 

7=1 

i = l, 2 ,..., a 

(4-2) 

i-l 

j = 1, %•••> b 

(4-3) 


y 

y - = 22 y* = 2 x = 2 x/ (4-4) 

<=i /=i <=i /»i 

De manera similar, y, es el promedio de las observaciones hechas bajo el tratamiento i,yj es el promedio 
de las observaciones del bloque j, y. es el gran promedio de todas las observaciones. Es decir, 

X. =y L /b y ^ = yj / a y /N (4-5) 

La suma de cuadrados total corregida puede expresarse como 

a b a b 

22 (y# - X ) 2 = 22 KX - X )+(y.y - y. )+(y, - X - y, +x )] 2 (4-6) 

1=1 ]= 1 f=l ;'“1 


1=1 7-1 


A1 desarrollar el miembro del lado derecho de la ecuacidn 4-6 se obtiene 

22 (y#- x ) 2 = *2 (x - x. ) 2 +a 2 o. t - y. ) 2 

i-l 7“1 

a k 

+2 2 (y# - x. - y.y + y. ) 2+2 22 (y. - y. xy, - y. ) 

i-l 7= 1 f=l j-1 

a b 

+2 2 2 (y.y - y. xx, - x. - y> + y. ) 

i-l 7‘“I 
a b 

+ 2 2 2 (x. - y. )(x> - x - y.y + x ) 


i=\ 7'— i 


Mediante procedimientos algebraicos simples, pero laboriosos, se prueba que los tres productos cruzados 
son cero. Por lo tanto. 


22 (yi/~y..) 2=b 2 (x.-y.) 2+a 2 (y.y-x) 2 

i-i j-i 1=1 y=i 


/-I 7=1 

7 ^ \ ^ .mj -T „ f 

.‘=1 7=1 
b_ 



+22 ov-y.y-x+y.) 2 

*= i y=i 

(4-7) 


representa una particidn de la suma de cuadrados total. A1 expresar simbdlicamente las sumas de cuadra- 
dos de la ecuacidn 4-7, se tiene 


SS T — 55 Tratamjeotos +SS Bloques +SS E (4-8) 

Puesto que hay N observaciones, SS T tiene N - 1 grados de libertad. Hay a tratamientos y b bloques, 
de donde 5S ltalamieiltos y S5 Bloque , tienen a - 1 y b - 1 grados de libertad, respectivamente. La suma de cuadra- 
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dos del error es solo la suma de cuadrados entre las celdas menos la suma de cuadrados de los tratamien- 
tos y los bloques. Hay ab celdas con ab - 1 grados de libertad entre ell as, de donde SS E tiene ab - 1 - (a - 1) 
_ (b - 1) = (a - l)(b - 1) grados de libertad. Ademas, la suma de los grados de libertad del lado derecho de 
la ecuacidn 4-8 es igual al total del lado izquierdo; por lo tanto, al establecer los supuestos de normalidad 
usuales para los errores, puede usarse el teorema 3-1 para demostrar que SSj^^tJa 2 , SS^^Jo 2 y 
SSe/o 2 son variables aleatorias ji-cuadrada con distribuciones independientes. Cada suma de cuadrados 
dividida por sus grados de libertad es un cuadrado medio. Puede demostrarse que el valor esperado de los 
cuadrados medios, si los tratamientos y los bloques son fijos, es 

b± t) 

E( MS Tratamientos ) = ^ ^ 

E(MS e ) = o 2 

Por lo tanto, para probar la igualdad de las medias de los tratamientos, se usarfa el estadistico de prueba 


F o=- 


MS. 


Tratamientos 

Mi J, 


que se distribuye como si la hipotesis nula es verdadera. La region critica es la cola superior de 

la distribucidn F, y H 0 se rechazaria si F 0 > F a a _ h (a-i)(b-iy 

Thm hi^.n podria haber inter6s en comparar las medias de los bloques porque, en caso de que la dife- 
rencia entre estas medias no sea considerable, quiza no sea necesaria la formacion de bloques en experi- 
mentos futures. Por los cuadrados medios esperados, aparentemente la hipotesis H 0 :^ = 0 puede 
probarse comparando el estadistico F 0 = MS Blaquc JMS £ con F a ^ ( fl -i)(i>-i)- Sin embargo, recuerde que la 
aleatorizacidn sdlo se ha aplicado a los tratamientos dentro de los bloques; es decir, los bloques represen- 
tan una restriccidn sobre la aleatorizacion. iQue efecto tiene esto sobre el estadistico F 0 = MS$\ 0 . 
qu JMS e ? Existen diferentes puntos de vista para abordar esta cuesti6n. Por ejemplo, Box, Hunter y Hun- 
ter [18] senalan que la prueba F del an^lisis de varianza comun puede justificarse exclusivamente con base 
en la aleatorizacidn, 1 sin el uso directo del supuesto de normalidad. Agregan que en la prueba para com- 
parar las medias de los bloques no puede recurrirse a dicha justificacion debido a la restriccidn sobre la 
aleatorizacion; pero si los. errores son NID(0, cr), puede usarse el estadistico F 0 = MS Bioqae JMS E para 
comparar las medias de los bloques. Por otra parte, Anderson y McLean [2] argumentan que la restric- 
ci6n sobre la aleatorizacidn impide que este estadistico sea una prueba significativa para comparar las 
medias de los bloques y que este codente F es en realidad una prueba de la igualdad de las medias de los 
bloques mds la restriccidn sobre la aleatorizacidn (a la que llaman el error de la restriccidn; ver Anderson 
y McLean [2] para detalles adicionales). 

Entonces, <.qu6 se hace en la pr&ctica? Debido a que con frecuencia el supuesto de normalidad es 
cuestionable, considerarF 0 = MS moqu JMS E como una prueba F exacta para la igualdad de las medias de 
los bloques no es una buena prictica general. Por esa razon, esta prueba F no se incluye en la tabla del 
an&lisis de varianza. Sin embargo, como un procedimiento aproximado para investigar el efecto de la va- 
riable formacidn de bloques, examinar el cociente MS moqa JMS E es muy razonable. Si este cociente es muy 


1 De hecho, la distribucidn F de la teorfa normal es una aproximacion de la distribucidn de aleatorizacion generada al calcular F„ a 

partir de cada asignacidn posible de las respuestas a los tratamientos. 
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Tabla 4-2 Andlisis de variama de un disefio de bloques completos aleatorizados 


Fuente de 
variacidn 

Suma de cuadrados 

Grados de 
libertad 

Cuadrado medio 

F « 

Tratamientos 

cc 

J J THitamientos 

a - 1 

^^Tratamientos 

a - 1 

MS 

i « ^Tratamientos 

MS, 

Bloques 

^Bloques 

b- 1 

‘^Bloques 

b - 1 


Error 

ss £ 

(a-l)(b-l) 

ss E 

(«-!)(*> -1) 


Tbtal 

SS T 

N-l 




grande, implica que el factor formacidn de bloques tiene un efecto considerable y que la reducci6n del 
ruido obtenida por la formacidn de bloques probablemente fue util para mejorar la precisidn de la com- 
paracion de las medias de los tratamientos. 

El procedimiento suele resumirse en un esquema de analisis de varianza, como el que se muestra en 
la tabla 4-2. En general, los calculos se realizarfan con un paquete de software de estadistica. Sin embar- 
go, es posible obtener f6rmulas de calculo manual de las sumas de cuadrados para los elementos de la 
ecuacidn 4-7 expres&ndolos en tdrminos de los totales de los tratamientos y los bloques. Estas formulas de 
calculo son 


Mr-22 yhjt 

1=1 j=l 

(4-9) 

1 a .,,2 

TratAmientos ^ y i. 

(4-10) 

ss ^.-l2 > 5-4 

j—\ 1 

(4-11) 

y la suma de cuadrados del error se obtiene por sustraccidn como 


SS E = SS T - 55 Tfatamient0S - SS B]oq[lc{t 

(4-12) 


EJEMPLO 4-1 

Considere el experimento de laprueba de la dureza de la section 4-1. Hay cuatro puntasy cuatro ejempla- 
res de prueba de metal. Cada punta se prueba una vez en cada ejemplar, resultando un diseiio de bloques 
completos aleatorizados. Los datos obtenidos se repiten por conveniencia en la tabla 4-3. Recuerde que 
el orden en que se probaron las puntas en un ejemplar particular se determino al azar. Para simplificar los 


labia 4-3 Disefio de bloques completos aleatorizados para el 
experimento de la prueba de la dureza 


Tipo de punta 

Ejemplar de prueba (bloque) 

1 

2 

3 

4 

1 

9.3 

9.4 

9.6 

10.0 

2 

9.4 

9.3 

9.8 

9.9 

3 

9.2 

9.4 

9.5 

9.7 

4 

9.7 

9.6 

10.0 

10.2 
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Tabla 4-4 Datos codiflcados del experimento de la prueba de la dureza 


Ejemplar de prueba (bloque) 


Tipo de punta 

1 

2 

3 

4 


1 

-2 

-1 

1 

5 

3 

2 

-1 

-2 

3 

4 

4 

3 

-3 

-1 

0 

2 

-2 

4 

2 

1 

5 

7 

15 

3V 

-4 

-3 

9 

18 

20 - 


calculos, los datos originales se codifican restando 9.5 de cada observation y multiplicando el resultado 
por 10. Se obtienen asi los datos de la tabla 4-4. Las sumas de cuadrados se obtienen de la siguiente manera: 




N 

2 


i'=l ;=1 

154.00 — ~~~ = 129.00 
16 
4 


SS T 


1 V 2 y - 
= b& y ‘~N 

= 7 t ( 3 ) 2 + ( 4 ) 2 +(- 2 ) 2 +( 15 ) 2 ]-^= 38.50 


4 lv ' V V V V-/ J 16 

55 = iy f-t, 

Bloques \T 


J - 1 


= \ [(— 4) 2 +(-3) 2 +(9) 2 +(18) 2 ]-*=£-= 82.50 


(20) 2 


■’E ~ ‘-’“-’Tratanuentos ^‘-’Bloques 

= 129.00- 38.50- 82.50= 8.00 


En la tabla 4-5 se presenta el analisis de varianza. Utilizando a = 0.05, el valor crftico de F es F 0 0S 3 9 = 
3.86. Puesto que 14.44 > 3.86, se concluye que el tipo de punta afecta la lectura de la dureza media. El va- 
lor P para la prueba tambien es muy pequeno. Ademas, al parecer los ejemplares (bloques) difieren de 
manera significativa, ya que el cuadrado medio de los bloques es grande en relacion con el error. 

Es interesante observar los resultados que se habrian obtenido si no se hubiera tenido conocimiento 
de los disenos de bloques aleatorizados. Suponga que se usaran cuatro ejemplares, asignando al azar las 
puntas a cada uno de ellos, y que resultara (por casualidad) el mismo disefio que el de la tabla 4-3. El an£- 
lisis incorrecto de estos datos como un diseno completamente aleatorizado de un solo factor se presenta 
en la tabla 4-6. 


Tabla 4-5 AnSlisis de varianza del experimento de la prueba de la dureza 


Fuente de 
variacidn 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

F o 

Valor P 

Tratamientos (tipo 
de punta) 

38.50 

3 

12.83 

14.44 

0.0009 

Bloques (ejemplares) 

82.50 

3 

27,50 



Error 

8.00 

9 

0.89 



Tbtal 

129.00 

15 
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Tabla 4-6 An^lisis incorrecto del experlmento de la prueba de la dureza 
como un disefio completamente aleatorizado 


Fuente de 
variacidn 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

F o 

Tipo de punta 

38,50 

3 

12.83 

1.70 

Error 

90,50 

12 

7.54 


Total 

129,00 

15 




Puesto queF 005 3 12 = 3.49, no puede rechazarse la hipotesis de la igualdad de las mediciones de la dureza 
media de las cuatro puntas. For lo tanto, el diseno de bloques aleatorizados reduce lo suficiente la canti- 
dad de ruido en los datos para que las diferencias entre las cuatro puntas sean detectadas. Esto ilustra un 
punto muy importante. Si un experimentador no recurre a la formacion de bloques cuando deberia ha- 
berlo hecho, el efecto puede ser inflar el error experimental a tal grado que las diferencias importantes 
entre las medias de los tratamientos sean indetectables. 


Muestra de salida de computadora 

En la figura 4-2 se muestra la salida de computadora condensada obtenida con Design-Expert para los da- 
tos de la prueba de la dureza del ejemplo 4-1 . Recuerde que en el analisis original de la tabla 4-5 se utiliza- 
ron datos codificados. (Las respuestas originates se codificaron restando 9.5 y multiplicando el resultado 
por 10.) El an&lisis de computadora utilizo las respuestas originates. Por consiguiente, las sumas de cua- 
drados de la figura 4-2 son iguales a las de la tabla 4-5 divididas entre 100 (observe que Design-Expert ha 
redondeado las sumas de cuadrados con dos cifras decimates). 

Los residuales se enlistan en la parte inferior de la salida de computadora. Estos se calculan como 

e a = y i j-y i j 

y, como se demostrara mas adelante, los valores ajustados son y v = y, + yj - y , de donde 

= (4-13) 

En la seccion siguiente se indicara como se usan los residuales en la verificacidn de la adecuacidn del modelo. 
Comparaciones multiples 

Si los tratamientos en un RCBD son fijos, y el analisis indica una diferencia significativa en las medias de 
los tratamientos, al experimentador le interesaran por lo general comparaciones multiples para descubrir 
cudles son los tratamientos cuyas medias difieren. Para ello puede utilizarse cualquiera de los procedi- 
mientos de comparaciones multiples del capitulo 3 (seccion 3-5). Simplemente se sustituye en las fdrmu- 
las de la secci6n 3-5 el numero de replicas (n) en el diseno completamente aleatorizado de un solo factor 
con el numero de bloques (b). Asimismo, es necesario recordar usar el numero de grados de libertad del 
error para el bloque aleatorizado [(a - l)(b - 1)] en lugar de los grados de libertad del diseno completa- 
mente aleatorizado [a{n - 1)]. 

En la salida de Design-Expert de la figura 4-2 se ilustra el procedimiento LSD de Fisher. Observe que 
si se usa a = 0.05, se concluiria que// 2 = p 3 . Ahora bien, puesto quey 3 < y 2 < y 2 . (es decir, las medias y 2 y 
y 3 abarcan algunas de las medias restantes), una conclusion inmediata seria que p l = p 2 = p 3 . Ademas, 
es diferente de las otras tres medias. Se concluye por lo tanto que la punta tipo 4 produce una dureza me- 
dia que es significativamente mas alta que las lecturas de la dureza media de los otros tres tipos de puntas. 
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Response: Hardness in Rockwell C 
ANOVA for Selected Factorial Model 
Analysis of variance table [Partial sum of squares] 



Sum of 

Mean 

F 


Source 

Squares 

DF Square 

Value Prob > F 


Block 

0.82 

3 0.27 



Model 

0.38 

3 0.13 

14.44 0.0009 

significant 

A 

0.38 

3 0.13 

14.44 0.0009 


Residual 

0.080 

9 8.889E-003 



Cor 

1.29 

15 



Total 





Std. Dev. 

0.094 

R-Squared 

0.8280 


Mean 

9.63 

Adj R-Squared 

0.7706 


C.V. 

0.98 

Pred R-Squared 

0.4563 


PRESS 

0.25 

Adeq Precision 

15.635 



Treatment Means (Adjusted, If Necessary) 



Estimated 

Standard 


Mean 

Error 

1-A1 

9.57 

0.47 

2-A2 

9.60 

0.47 

3-A3 

9,45 

0.47 

4'A4 

9.88 

0.47 


Mean 

Treatment Difference 

Standard 

DF Error 

t for Ho 
Coeff=0 

Prob > 1 1 1 


1 vs 2 

-0.025 

1 

0.067 

-0.38 

0.7163 


1 vs 3 

0.13 

1 

0,067 

1.87 

0.0935 


1 vs 4 

-0.30 

1 

0.067 

-4.50 

0.0015 


2 vs 3 

0.15 

1 

0.067 

2.25 

0.0510 


2 vs 4 

-0.27 

1 

0.067 

-4.12 

0.0026 


3 vs 4 

-0.43 

1 

0.067 

-6.37 

0,0001 


Diagnostics Case Statistics 
Standard Actual Predicted 

Order Value Value 

Residual Leverage 

Student 

Residual 

Cook's 

Distance 

Outlier 

t 

1 

9.30 9.35 


-0.050 0.438 

-0.707 

0.056 

-0.686 

2 

9.40 9.38 


0.025 0.438 

0.354 

0.014 

0.336 

3 

9.60 9.67 


-0.075 0.437 

-1.061 

0.125 

-1.069 

4 

10.00 9.90 


0.100 0.438 

1.414 

0.222 

1.512 

5 

9.40 9.38 


0.025 0.438 

0.354 

0.014 

0.336 

6 

9.30 9.40 


-0.100 0.437 

-1.414 

0.222 

-1.512 

7 

9.80 9.70 


0.100 0.437 

1.414 

0,222 

1.512 

8 

9.90 9.93 


-0.025 0.437 

-0.354 

0.014 

-0.336 

9 

9.20 9.22 


-0.025 0.438 

-0,354 

0.014 

-0.336 

10 

9.40 9.25 


0.150 0.437 

2,121 

0.500 

2.828 

11 

9.50 9.55 


-0.050 0.437 

-0.707 

0.056 

-0.686 

12 

9.70 9.78 


-0.075 0.437 

-1.061 

0.125 

-1,069 

13 

9.70 9.65 


0.050 0.438 

0.707 

0.056 

0.686 

14 

9.60 9.68 


-0.075 0.437 

-1.061 

0.125 

-1.069 

15 

10.00 9.97 


0.025 0.437 

0.354 

0.014 

0.336 

16 

10.20 10.20 


0.000 0.437 

0,000 

0,000 

0-000 

Fi^ura 4-2 

Salida de Design-Expert (condensada) para el ejemplo 4-1 . 
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Punta 

3 


Punta Punta 
1 2 

• — 


Punta 
4 , 


-1 


Dureza promedio (codificada) 


Figura 4-3 Las medias del tipo de punta en rel acidn co n una distribucidn t esca- 
lada con un factor de escalacidn <JMS E / b - VO.89/4 = 0.47* 


Thmbien puede usarse el procedimiento grafico del capitulo 3 (seccidn 3-5.1) para comparar las me- 
dias del tipo de punta. En la figura 4-3 se grafican las cuatro medias del tipo de punta de l ejemplo 4-1 en 
relation con una distribucidn t escalada con un factor de escalacidn 1 [MS E fb = -v/0.89 / 4 = 0.47. Esta gr&- 
fica indica que las puntas 1, 2 y 3 producen probablemente mediciones de la dureza promedio identicas, 
pero que la punta 4 produce una dureza media mucho m^s alta. Esta figura confirma los resultados de la 
prueba LSD de Fisher incluida en la salida de Design-Expert de la figura 4-2. 

4-1*2 Verification de la adecuacion del modelo 

Se ha comentado ya la impoitancia de verificar la adecuacidn del modelo supuesto. En general, debera 
estarse alerta a los problemas potenciales con el supuesto de normalidad, con la desigualdad de la varian- 
za por tratamiento o bloque, y con la interaction bloque-tratamiento. Como en el diseno completamente 
aleatorizado, el an£lisis residual es la herramienta principal que se utiliza en estos diagndsticos de verifi- 
cacidn. En la parte inferior de la salida de Design-Expert de la figura 4-2 se enlistan los residuales del dise- 
no de bloques aleatorizados. Los residuales codificados se encontrarian multiplicando estos residuales 
por 10. Las observaciones, los valores ajustados y los residuales de los datos codificados de la prueba de la 
dureza del ejemplo 4-1 son los siguientes: 


yv 

9, 

e ij 

- 2.00 

- 1.50 

“ 0.50 

- 1.00 

- 1.25 

0.25 

1.00 

1.75 

- 0,75 

5.00 

4.00 

1.00 

- 1.00 

- 1.25 

0.25 

- 2.00 

- 1.00 

- 1,00 

3.00 

2.00 

1.00 

4.00 

4.25 

- 0,25 

- 3.00 

- 2.75 

- 0,25 

- 1.00 

- 2.50 

1.50 

0.00 

0.50 

- 0.50 

2,00 

2.75 

- 0.75 

2.00 

1.50 

0.50 

1.00 

1.75 

- 0,75 

5,00 

4.75 

0.25 

7.00 

7.00 

0.00 


En la figura 4-4 se muestra la gr&fica de probabilidad normal y el diagrama de puntos de estos resi- 
duales. No hay indicios marcados de no normalidad y tampoco hay evidencia que apunte a la posible pre- 
sencia de puntos atipicos. En la figura 4-5 se muestran las gr&ficas de los residuales por tipo de punta o 
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bloque 1 en conjunto es£(y n ) = ,a+t 1 +/? 1 =: / u + 5 + 2= /* + 7.En general, el tratamiento 1 incrementa 
siempre la respuesta esperada 5 unidades sobre la suma de la media global y del efecto del bloque, 
Aun cuando este modelo aditivo simple muchas veces es util, hay situaciones en las que resulta inade- 
cuado. Suponga, por ejemplo, que se est£n comparando cuatro formulaciones de un producto quimico 
utilizando seis lotes de materia prima; los lotes de materia prima se consideran bloques. Si una impureza 
en el lote 2 afecta de manera adversa la formulacion 2, dando como resultado un rendimiento inusual- 
mente bajo, pero no afecta las demas formulaciones, ha ocurrido una interaction entre las formulaciones 
(o tratamientos) y los lotes (o bloques). De manera similar, pueden ocurrir interaceiones entre los trata- 
mientos y los bloques cuando la respuesta se mide en la escala incorrecta. Por lo tanto, una relaridn que es 
multiplicativa en las unidades originales, por ejemplo 

E(yij) = V*iP j 

es lineal o aditiva en una escala logaritmica, ya que, por ejemplo, 

lnE(y ij )- ln/^ + lnr,. +ln fi } 


o 


E( y ;)=p+ r;+/s; 

Aun cuando este tipo de interaccion puede eliminarse con una transformacidn, no todas las interaceiones 
pueden tratarse con tanta facilidad, Por ejemplo, una transformacidn no elimina la interaccidn formula- 
cidn-lote que se sehald antes, El analisis residual y otros procedimientos de diagndstico de verification 
pueden ser utiles para detectar la no aditividad. 

Si una interaccion esta presente, puede afectar seriamente el analisis de varianza y posiblemente lo 
invalide. En general, la presencia de una interaccidn infla el cuadrado medio del error y puede afectar ad- 
versamente la comparacidn de las medias de los tratamientos. En situaciones en las que ambos factores, 
asi como su posible interaccidn, son de interns, deben usarse disenos factoriales. Estos disenos se anali- 
zan en detalle en los capitulos 5 al 9. 


Tratamientos y bloques aleatorios 

Aun cuando el procedimiento de prueba se ha descrito considerando los tratamientos y los bloques como 
factores fijos, se utiliza el mismo procedimiento de andlisis si los tratamientos o los bloques (o ambos) son 
aleatorios. Sin embargo, hay algunas modificaciones en la interpretacidn de los resultados. Por ejemplo, 
si los bloques son aleatorios, como es con mucha frecuencia el caso, se espera que las comparaciones en- 
tre los tratamientos sean las mismas a lo largo de la poblacidn de bloques de la cual se seleccionaron alea- 
toriamente para realizar el experimento. Estan tambien las modificaciones correspondientes en los 
cuadrados medios esperados. Por ejemplo, si los bloques son variables aleatorias independientes con va- 
rianza comun, entonces E(MS moqncs ) = a 2 4- act* , donde o 2 ^ es el componente de la varianza de los efectos 
de los bloques. En cualquier situacidn, £(M£^ atamient0S ) siempre est& libre de cualquier efecto de bloque, y 
el estadistico de prueba para la variabilidad entre los tratamientos siempre esF 0 = 

En situaciones en las que los bloques son aleatorios, si esta presente una interaccidn tratamien- 
to-bloque, las pruebas para las medias de los tratamientos no est&n afectadas por la interaccidn. La razdn 
de ello es que los cuadrados medios esperados de los tratamientos y del error contienen ambos el efecto 
de la interaccion; por consiguiente, la prueba de las diferencias en las medias de los tratamientos puede 
realizarse como de costumbre comparando el cuadrado medio de los tratamientos con el cuadrado medio 
del error, Este procedimiento no proporciona ninguna informacion acerca de la interaccidn. 
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Elecci6n del tamano de la muestra 

La eleccidn del tamano de la muestra, o numero de bloques que deben correrse, es una decision impor- 
tante cuando se usaun RCBD. A1 incremental el numero de bloques, se incrementa el numero de replicas 
y el numero de grados de libertad del error, con lo cual se aumenta la sensibilidad del diseno. Cualquiera 
de las tgcnicas descritas en el capitulo 3 (seccidn 3-7) para seleccionar el numero de replicas que deben 
correrse en un experimento completamente aleatorizado con un solo factor puede aplicarse de forma di- 
recta al RCBD. Para el caso de un factor fijo, las curvas de operacion caracteristica de la parte V del apen- 
dice pueden usarse con 



<& 2 = (4-14) 

/I/Y * 


donde hay a - 1 grados de libertad en el numerador y ( a - 1)(6 - 1) grados de libertad en el denominador. 


EJEMPLO 4-2 

Considere el problema de laprueba de la dureza del ejemplo 4-1. Suponga que quiere determinarse el nu- 
mero apropiado de bloques que deben correrse si el interns se encuentra en detectar una diferencia maxi- 
ma real en las lecturas de la dureza media de 0.4 con una alta probabilidad, y una estimation razonable 
de la desviacidn est&ndar de los errores es a = 0.1. (Estos valores se dan en las unidades originates; recuerde 
que el andlisis de varianza se realizo usando datos codificados.) Por la ecuacion 3-49, el valor minimo 
de O 2 es (escribiendo b, el numero de bloques, en lugar de n) 


<D 2 


fr£> 2 

2ao 2 


donde D es la diferencia maxima que quiere detectarse. Por lo tanto, 


<I > 2 


fr(0.4) 2 

2(4)(0.1) 2 


= 2.0 b 


Si se usan b = 3 bloques, entonces = V2.0b = V2.0(3) = 2.45, y hay (a - l)(b - 1) = 3(2) = 6 grados de li- 
bertad del error. La parte V del apendice con v, = « - 1 = 3 y a = 0.05 indica que el riesgo /? de este diseno 
es aproximadamente 0.10 (potencia = 1 -/? = 0.90). Si se usan b = 4 bloques, <t> = V2.0b = V2.0(4) = 2.83, 
con (a - l)(b - 1) = 3(3) = 9 grados de libertad del error, y el riesgo p correspondiente es aproximada- 
mente 0.03 (potencia = 1 -fi = 0.97). Ties o cuatro bloques daran como resultado un diseno con una alta 
probabilidad de detectar la diferencia entre las lecturas de la dureza media consideradas importantes. 
Debido a que los ejemplares de prueba (bloques) son baratos y estan en disponibilidad y el costo de la 
prueba es bajo, el experimentador decide usar cuatro bloques. 


Estimacidn de valores faltantes 

Cuando se usa el RCBD, en ocasiones falta una observacion en uno de los bloques. Esto puede ocurrir de- 
bido a descuido o error o por razones fuera del control del experimentador, tal como un dano inevitable a 
una unidad experimental. Una observacion faltante introduce un nuevo problema en el an&lisis debido a 
que los tratamientos dejan de ser ortogonales a los bloques; es decir, no ocurren todos los tratamientos en 
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Tabla 4-7 Disefio de bloques completes aleatorizados para el 

experimento de la prueba de dureza con un valor faltante 


Tipo de punta 

Ejemplar de prueba (bloque) 


1 

2 

3 

4 

1 

-2 

-1 

1 

5 

2 

-1 

-2 

jc 

4 

3 

“3 

-1 

0 

2 

4 

2 

1 

5 

7 


cada uno de los bloques. Existen dos enfoques generales para el problema de los valores faltantes. El pri- 
mero es un an&lisis aproximado, en el cual la observacion faltante se estimay se lleva a cabo el an^Llisis de 
varianza usual como si la observacidn estimada fuera un dato real, con los grados de libertad del error re- 
ducidos en 1. Este analisis aproximado es materia de esta seccion, El segundo es un analisis exacto, el cual 
se revisa en la seccidn 4-1.4. 

Suponga que falta la observacion y i} del tratamiento i en el bloque j\ La observacion faltante se denota 
comox. Como una ilustracidn, suponga que en el experimento de la prueba de dureza del ejemplo 4-1 el 
ejemplar de prueba 3 se rompid mientras se probaba la punta 2 y que no pudo obtenerse el dato para esa 
punta. Los datos aparecerian como en la tabla 4-7. 

En general, se hard que y‘ represente el gran total con una observacidn faltante, que y! represente el 
total del tratamiento con una observacidn faltante, y que y'j sea el total del bloque con una observacidn 
faltante. Suponga que quiere estimarse la observacidn faltante x de tal modo quex tenga una participa- 
cidn minima en la suma de cuadrados del error. Puesto que SS E - — y L — y j +y ) 2 , esto es 

equivalente a elegir x: para minimizar 


a b a 

ss e = 'Z'Z yh hi, 


i=l 7=1 




= x 2 -\{? L +x) 2 -fa +*) z +fa +x) 2 +R 


(4-15) 


donde R incluye todos los tdrminos en los que no interviene x. A partir de dSS E /cbc— 0, se obtiene 

a y[ +by'j - y’ 


X — 




(4-16) 


como la estimacion de la observacion faltante. 

Para los datos de la tabla 4-7, se encuentra que y’ 2 = 1, y = 6 y y[ 
4-16, 


X ^ y 22 


4(l) + 4(6) -17 

(3)(3) 


17. Por lo tanto, por la ecuacidn 


Ahora puede realizarse el analisis de varianza comun utilizando^ = 1.22 y reduciendo los grados de li- 
bertad del error en 1. El analisis de varianza se muestra en la tabla 4-8. Compare los resultados de este 
andlisis aproximado con los resultados obtenidos para el conjunto de datos completo (tabla 4-5). 
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labia 4-8 An&lisis de varianza aproximado del ejemplo 4-1 con un valor faltante 


Fuente de variacidn 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

F „ 

Valor P 

Tipo de punta 

39.98 

3 

13.33 

17,12 

0.0008 

Ejemplares de prueba (bloques) 

79.53 

3 

26.51 



Error 

6.22 

8 

0.78 



Tbtal 

125.73 

14 





Si son varias las observaciones faltantes, pueden estimarse escribiendo la suma de cuadrados del 
error como una funcion de los valores faltantes, derivando con respecto a cada valor faltante, igualando 
los resultados con cero y resolviendo las ecuaciones resultantes. De manera alternativa, puede usarse la 
ecuacidn 4-16 de manera iterativa para estimar los valores faltantes. Para ilustrar el enfoque iterativo, su- 
ponga que faltan dos valores. Se estima arbitrariamente el primer valor faltante y despues se usa este va- 
lor junto con los datos reales y la ecuacidn 4-16 para estimar el segundo. Entonces puede usarse la 
ecuacidn 4-16 para volver a estimar el primer valor faltante, y despues de esto, puede volver a estimarse el 
segundo. Este proceso se continua hasta que se obtiene la convergencia. En cualquier problema con valo- 
res faltantes, los grados de libertad del error se reducen en una unidad por cada observacion faltante. 


4-1.4 Estimacidn de los pardmetros del tnodelo y la prueba general 
de signification de la regresidn 


Si tanto los tratamientos como los bloques son fijos, los par&metros del RCBD pueden estimarse por mi- 
nimos cuadrados. Recuerde que el modelo estadistico lineal es 




= p+r.+p.+e ii 


i- 1, 2 ,..., a 
j — 1) 2 ,..., b 


(4-17) 


A1 aplicar las reglas de la seccidn 3-9.2 para encontrar las ecuaciones normales del modelo de un diseno 
experimental, se obtiene 


abfi 




bi 2 + • 

•* + bt a + + 

a Pi 

4 - 

- 4 

apt = y.. 

r x : bjX 

+ 

bi 2 



+ 

A + 

A 

4 ** 

- 4 

K =yi. 

r 2 : bjx 



+ 

bi 2 

+ 

A + 

A 

4 ■■ 

■ 4 

h = y 2 . 

t a : bp, 





+ br a 4- 

A + 

A 

4 •« 

- 4 

K = y*. 

Pi- a P 

+ 

Ti 

+ 

r 2 + • 

■■ + i a + aft i 




= y.i 

Pi- ap 

+ 

fj 

+ 

i 2 + • 

+ K 

+ 

ak 



= y . 2 

Pb- ap 

+ 


H- 

x 2 4- • 

■■ + % 




4 

a Pb = y.b 


(4-18) 


Observe que la suma de la segunda a la (a + l)-esima ecuaciones de la ecuacion 4-18 es la primera 
ecuacion normal, como tambidn es el caso de las b Ultimas ecuaciones. Por lo tanto, hay dos dependencias 
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lineales en las ecuaciones normales, lo cual implica que deben imponerse dos restricciones para resolver 
la ecuacidn 4-18. Las restricciones usuales son 




(4-19) 


Al utilizar estas restricciones, las ecuaciones normales se simplifican considerablemente. De hecho, que- 
dan como 


cuya solucidn es 


abfi = y 


bft+bT. = y. 

2 = 1, 2,„,, a 

(4-20) 

afi+aPj = yj 

j=l, 2,..., b 


£ = ?.. 

fi = y i -y. 

i = 1, 2,..., a 

(4-21) 

Pj = y.i-y.. 

; = 1, 2,..., b 



Al utilizar la solucion de la ecuacion normal de la ecuacion 4-21, puede encontrarse el valor estimado o 
ajustado de y tj como 

= y_+(y l .~y..) + (y.j-y..) 

= y, +y.j - y. 

Este resultado se u$6 anteriormente en la ecuaci6n 4-13 para calcular los residuales de un diseno de blo- 
ques aleatorizados. 

La prueba general de significacidn de la regresidn puede usarse para desarrollar el analisis de varian- 
za del diseno de bloques completos aleatorizados. Al utilizar la solucion de las ecuaciones normales dada 
por la ecuacidn 4-21, la reduccidn en la suma de cuadrados para ajustar el modelo completo es 

a b 

/?(/<, r, fi)= fxy +2 *, y,. +2 hy.i 
«=1 ;*l 

<i b_ 

= y.. y.. + X (?.. - y. )y>. + 2 O', - y. )y.j 

.=i j=i 


„2 a *» 2 b i» 2 

y. y .-l L + y y.y.-^L 

ab £ y, y ‘ ab £ y,y -> ab 




a ab 


con a + b - 1 grados de libertad, y la suma de cuadrados del error es 


a b 


ss b = 2'Z yfj-K(^P) 


1-1 jm 1 
a b 




i=l j=l 
b 


i- 1 b U a ab 


= 22 (yn-yi-y.j+y.) 2 


i=l ;= 1 
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con (a - 1 )(b - 1) grados de libertad. Compare esta ultima ecuacidn con SS E en la ecuacion 4-7. 
Para probar la hip6tesis Hq.z, = 0, el modelo reducido es 

y,j=f*+Pj+£ii 

que es un analisis de varianza de un solo factor. Por analogfa con la ecuacion 3-5, la reduccion en la suma 
de cuadrados para ajustar el modelo reducido es 

* y 2 

ro*j)=2 ~ 

y- 1 


que tiene b grados de libertad. Por lo tanto, la suma de cuadrados debida a {r ( } despuds de ajustar fi y 
W es 


R(A fa P ) = r > P) — Rifa P) 

~ J?(Modelo completo)— /?(Modelo reducido) 


= y 2L+V 

h + ^ n nh n 


v 2 „ 2 * v 2 

y.j y.. v y i 


>=i 


M 


ab 


y-i 


t yL-i 1 

h b ab 


expresidn que se identifica como la suma de cuadrados de los tratamientos con a - 1 grados de libertad 
(ecuacion 4-10). 

La suma de cuadrados de los bloques se obtiene ajustando el modelo reducido 

y^fi+z^e.. 

que tambidn es un an&lisis de un solo factor. De nueva cuenta, por analogfa con la ecuacion 3-5, la reduc- 
cidn en la suma de cuadrados para ajustar este modelo es 

*(**>- s 4 

con a grados de libertad. La suma de cuadrados de los bloques {/? y } despu6$ de ajustar // y {r,} es 

R(P I n, *) = R(v, P)- R(n> T ) 



con b - 1 grados de libertad, la cual se habfa dado anteriormente como la ecuacidn 4-11. 

Se han desarrollado las sumas de cuadrados de los tratamientos, de los bloques y del error en el dise- 
no de bloques completos aleatorizados utilizando la prueba general de significacion de la regresidn. Aun 
cuando la prueba general de significacidn de la regresion no se usarfa ordinariamente para hacer el anili- 
sis real de los datos en un bloque completo aleatorizado, en ocasiones el procedimiento resulta util en di- 
sefios de bloques aleatorizados mds generales, como los que se revisan en la section 4-4. 
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An£lisis exacto del problema del valor faltante 

En la seccidn 4-1.3 se presento un procedimiento aproximado para solucionar las observaciones faltantes 
en el RCBD. Este an&lisis aproximado consiste en estimar el valor faltante de tal modo que se minimice el 
cuadrado medio del error. Puede demostrarse que el analisis aproximado produce un cuadrado medio 
sesgado de los tratamientos en el sentido de que £(MS^ atamientos ) es mayor que E(MS e ) si la hipotesis nula 
es verdadera. Por consiguiente, se reportan demasiados resultados significativos. 

El problema del valor faltante puede analizarse exactamente utilizando la prueba general de 
significacidn de la regresidn. El valor faltante hace que el diseno sea no balanceado, y dado que no todos 
los tratamientos ocurren en todos los bloques, se dice que los tratamientos y los bloques no son ortogona- 
les. Este mdtodo de analisis tambien se usa en tipos m£s generales de disenos de bloques aleatorizados; el 
tema se analiza con mayor amplitud en la seccidn 4-4. En el problema 4-26 se le pide al lector que realice 
el an&lisis exacto para un diseno de bloques completos aleatorizados con un valor faltante. 


4*2 DISENO DE CUADRADO LATINO 

En la seccidn 4-1 se introdujo el diseno de bloques completos aleatorizados como un diseno para reducir 
el error residual de un experimento al eliminar la variabilidad debida a una variable perturbadora conoci- 
da y controlable. Hay otros tipos de disenos que utilizan el principio de la formacion de bloques. Por 
ejemplo, suponga que un experimentador estudia los efectos que tienen cinco formulacipnes diferentes 
de la carga propulsora utilizada en los sistemas de expulsion de la tripulacidn de un avidn basado en la ra- 
pidez de combustion. Cada formulacidn se hace con un lote de materia prima que s61o alcanza para pro- 
bar cinco formulaciones. Adem&s, las formulaciones son preparadas por varios operadores, y puede 
haber diferencias sustanciales en las habilidades y experiencia de los operadores. Por lo tanto, al parecer 
hay dos factores perturbadores que seran “calculados en promedio” en el diseno: los lotes de materia pri- 
ma y los operadores. El diseno apropiado para este problema consiste en probar cada formulacidn exac- 
tamente una vez con cada uno de los cinco operadores. Al diseno resultante, ilustrado en la tabla 4-9, se le 
llama diseno de cuadrado latino. Observe que el diseno es un arreglo cuadrado y que las cinco formula* 
ciones (o tratamientos) se denotan por las letras latinas^4, B, C,DyE; de ahi el nombre de cuadrado lati- 
no. Se observa que tanto los lotes de materia prima (renglones) como los operadores (columnas) son 
ortogonales a los tratamientos. 

El diseno de cuadrado latino se usa para eliminar dos fuentes de variabilidad perturbadora; es decir, 
permite hacer la formacion de bloques sistem&tica en dos direcciones. Por lo tanto, los renglones y las co- 
lumnas representan en realidad dos restricciones sobre la aleatorizacidn. En general, un cuadrado latino 
para p factores, o cuadrado latino p x p, es un cuadrado con p renglones y p columnas, Cada una de las p 2 


Tabla 4-9 Disefio del cuadrado latino para el problema de la carga propulsora 


s de materia 
prima 


Operadores 



1 

2 

3 

4 

5 

1 

A = 24 

£ = 20 

C =19 

D = 24 

£ = 24 

2 

B - 17 

C = 24 

D - 30 

£ = 27 

,4 = 36 

3 

C= 18 

D = 38 

E = 26 

A = 21 

£ = 21 

4 

D — 26 

E = 31 

A = 26 

B = 23 

C = 22 

5 

E = 22 

A = 30 

B = 20 

C = 29 

D = 31 
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celdas resultantes contiene una de las p letras que corresponde a los tratamientos, y cada letra ocurre una 
y s61o una vez en cada rengldn y columna. Algunos ejemplos de cuadrados latinos son 


4x4 

5x5 

6x6 

ABDC 

ADBEC 

ADCEBF 

BCAD 

DACBE 

BAECFD 

CDBA 

CBEDA 

CEDFAB 

DACB 

BEACD 

DCFBEA 


ECDAB 

FBADCE 



EFBADC 

El modelo estadistico de un cuadrado latino es 




i = l, 2 ,..., p 

y ijk = [i+a , +Tj +fi k 

7 = 1, 2 ,..., p 


* = 1 , 2 ,..., p 


dondey,^ es la observacidn en el rengldn i-esimo y la columna fc-6sima para el tratamiento j-esimo,/< es la 
media global, a, es el efecto del rengldn i-dsimo, r y es el efecto del tratamiento y'-dsimo,/?* es el efecto de la 
columna &-6sima, y e ijk es el error aleatorio. Observe que se trata de un modelo de los efectos. El modelo es 
completamente aditivo; es decir, no hay interacrion entre renglones, columnas y tratamientos. Puesto 
que hay una sola observacidn en cada celda, s61o se necesitan dos de los tres subindices i,j yk para denotar 
una observacidn particular. Por ejemplo, con referencia al problema de la carga propulsora de la tabla 
4-9, si i = 2y k = 3, se encuentra automdticamente que j = 4 (formulacidnD), y si i = 1 yj = 3 (formula- 
ci6n C), se encuentra que k- 3. Esta es una consecuencia de que cada tratamiento aparezca una vez exac- 
tamente en cada rengldn y columna. 

El analisis de varianza consiste en hacer la particidn de la suma de cuadrados total de las N =p 2 ob- 
servaciones en los componentes de los renglones, las columnas, los tratamientos y el error, por ejemplo, 

SSj = SS Reng|oncs + ^Columnas ‘^Tratamientos (4-23) 

con los respectivos grados de libertad 


p 2 -1= p-l + p-l+p-l+(p-2)(p-l) 

Bajo el supuesto usual de que t: ljk es NID(0, a 2 ), cada suma de cuadrados del lado derecho de la ecuacion 
4-23 es, al dividir por a 2 , una variable aleatoria ji-cuadrada con una distribucidn independiente. El esta- 
distico apropiado para probar que no hay diferencias en las medias de los tratamientos es 


=■ 


MS t 


.MS, 


que se distribuye comoF p _ 1(# ,_ 2)0 ,_ 1) bajo la hipdtesis nula. Thmbien puede probarse la ausencia de efectos 
de los renglones o la ausencia de efectos de las columnas formando el cociente de one8 o M5 a ,, limnas 
con MS e . Sin embargo, puesto que los renglones y las columnas representan restricciones sobre la aleato- 
rizacion, estas pruebas quiza no sean apropiadas. 

En la tabla 4-10 se presenta el procedimiento de calculo para el analisis de varianza. Por las formulas 
de calculo para las sumas de cuadrados, se observa que el an&lisis es una extensidn simple del RCBD, con 
la suma de cuadrados resultante de los renglones obtenida a partir de los totales de los renglones. 
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labia 4-10 Andlisis de varianza del disefio del cuadrado latino 


Fuente de 


Grados de 



variation 

Suma de cuadrados 

libertad 

Cuadrado medio 

Fo 

Tratamientos 

vc _Iv 2 _yl 

^^Tratamientas p ft/ ■ jy 

p - 1 

U ^Tratamicnt05 

P-1 

MS 

JMU Tratam j eot(JS 

0 MS E 

Renglones 

1 P ,,2 
cc = iv 

^Renglones J i., 

P im 1 

p - i 

CC 

J|J Renglones 

P-1 


Columnas 

ve =IV = _zl 

‘^Cohimnas ^ y .Jc ^y 

p-i 

ec 

JJ Columnas 

£-1 


Error 

SS E (por sustraccidn) 

(P - 2)(p - 1) 

(P-2)(P“1) 


Tbtal 

**-222*4 

i j k iV 

P 2 -l 




EJEMPLO 4-3 

Considere el problema de la carga propulsora descrito previamente, donde tanto los lotes de materia pri- 
ma como los operadores representan restricciones sobre la aleatorizacidn. El diseno para este experi- 
mento, el cual se muestra en la tabla 4-9, es un cuadrado latino 5x5. Despuds de codificar los datos 
restando 25 de cada observacidn, se obtienen los datos de la tabla 4-11. Las sumas de cuadrados del total 
de los lotes (renglones) y los operadores (columnas) se calculan de la siguiente manera: 


i j k ^ 


68°-^-= 676.00 
25 

P ,.2 




N 

= ~[(-i4) 2 + 9 2 +5 2 +3 2 +7 2 ]-^-= 68.00 

14 2 


yy = — V 2 y -- 

Operadonss 


= i[(-18)’ +1S 1 +(-4) 2 +5" +9’ 150.00 


Tabla 4-11 Datos codificados para el problema de la carga propulsora 


Lotes de 
materia prima 



Operadores 



ft. 

l 

2 

3 

4 

5 

1 

=-i 

R = - 5 

C — -6 

£> = -1 

£= -1 

-14 

2 

B=-8 

C = -1 

£> = 5 

£ = 2 

yl = 11 

9 

3 

C=-7 

£> = 13 

£= 1 

,4= 2 

£ = -4 

5 

4 

Z) = 1 

£ = 6 

A — 1 

5 = -2 

C= -3 

3 

5 

£=-3 

>4- 5 

fl = -5 

C = 4 

Z)= 6 

7 

y.k 

-18 

18 

-4 

5 

9 

10= y. 



4-2 DISENODECUADRADO LATINO 147 


Tabla 4-12 AnSlisis de varianza del experimento de la carga propulsora 


Fuente de variacidn 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

F o 

Valor P 

Formulaciones 

330.00 

4 

82.50 

7.73 

0.0025 

Lotes de materia prima 

68.00 

4 

17.00 



Operadores 

150.00 

4 

37.50 



Error 

128.00 

12 

10.67 



Tbtal 

676.00 

24 





Los totales para los tratamientos (las letras latinas) sol 


Letra latina 

A ~ 

B 

C 

D 

E 


Total del tratamiento 

>.i.= 18 

Vx = -24 
Vx = -13 
X4.= 24 
y. 5 . = 5 


La suma de cuadrados que resulta de las formulaciones se calcula a partir de estos totales como 


SS 


Formulaciones 


1 P 

=iy _2L 

Pjk ’■ N 

18 2 +(-24) 2 +(—13) 2 +24 2 + 5 2 (10) 2 , = 

5 25 


La suma de cuadrados del error se encuentra por sustraccion: 

SS E — SS T — "" ‘55 0peTadonj3 — ^Formulaciones 

= 676.00- 68.00- 150.00- 330.00 = 128.00 


El an£lisis de varianza se resume en la tabla 4-12. Se concluye que hay una diferencia significativa en 
la rapidez de combustidn media generada por las diferentes formulaciones de la carga propulsora. Thm- 
bi£n hay indicios de que hay diferencias entre los operadores, por lo que la formacidn de bloques de este 
factor fue una buena precaution. No hay evidencia $61ida de una diferencia entre los lotes de materia pri- 
ma, por lo que al parecer en este experimento particular hubo una preocupacidn innecesaria en esta fuen- 
te de variabilidad. Sin embargo, la formation de bloques de los lotes de materia prima es por lo general 
una buena idea. 


Como en cualquier problema de diseno, el experimentador deberfa investigar la adecuacidn del mo- 
delo inspeccionando y graficando los residuales. Para un cuadrado latino, los residuales est£n dados por 

^ijk ~ y ijk ~ y ijk 

- ~ h. ~ y.j. ~ y..k +2 y... 

El lector debera encontrar los residuales del ejemplo 4-4 y construir las graficas apropiadas. 
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Tabla 4-13 Cuadrados latinos estandares y nflmero de cuadrados latinos de varios tamafios 1 ' 


T&mano 

3x3 

4x4 

5x5 

6x6 

7x7 

p x p 

Ejemplos de 

ABC 

ABCD 

ABCDE 

ABCDEF 

ABCDEFG 

ABC ,.,P 

cuadrados estandares 

BCA 

BCDA 

BAECD 

BCFADE 

BCDEFCA 

BCD ...A 


CAB 

CDAB 

DABC 

CDAEB 

DEBAC 

ECDBA 

CFBEAD 

DEABFC 

EADFCB 

FDECBA 

CDEFGAB 

DEFGABC 

EFGABCD 

FGABCDE 

GABCDEF 

CDE...B 

PAB ...(P-1) 

Numero de cuadrados 
estandares 

1 

4 

56 

9408 

16,942,080 

- 

Numero total de 
cuadrados latinos 

12 

576 

161,280 

818,851,200 

61,479,419,904,000 

p\(p - 1)! x 
(numero de 
cuadrados estandares) 


“Parte de la informacidn de esta tabla se enoientra en Statistical Thbles for Biological, Agricultural and Medical Research 7 4a, edicibn, de R.A. Fisher y F. Yates, Oliver & Boyd, 
Edimburgo- Es poco lo que se sabe de las propiedades de los cuadrados latinos m«is grandes que 7x7. 


A un cuadrado latino en el que el primer rengldn y la primera columna constan de letras escritas en 
orden alfabetico se le llama cuadrado latino estandar, que es el diseno que se utilizo en el ejemplo 4-3. 
Siempre es posible obtener un cuadrado latino estfindar escribiendo el primer renglon en orden alfabeti- 
co y escribiendo despu6s cada rengldn sucesivo como la sucesion de letras que est&n justo arriba, recorri- 
das un lugar a la izquierda. En la tabla 4-13 se resumen varios hechos importantes acerca de los cuadrados 
latinos y de los cuadrados latinos estandares. 

Como con cualquier diseno experimental, las observaciones del cuadrado latino deberan tomarse de 
manera aleatoria. El procedimiento de aleatorizacidn correcto es seleccionando al azar el cuadrado em- 
pleado. Como se observa en la tabla 4-13, hay un gran numero de cuadrados latinos de un tamano particu- 
lar, por lo que es imposible enumerar todos los cuadrados y seleccionar uno al azar. El procedimiento 
usual es seleccionar un cuadrado latino de una tabla de estos disenos, como en Fisher y Yates [45], y des- 
pu6s arreglar al azar el orden de los renglones, las columnas y las letras. Esto se analiza con mayor detalle 
en Fisher y Yates [45]. 

Ocasionalmente, falta una observacidn en un cuadrado latino. Para un cuadrado latino p x p, el valor 
faltante puede estimarse con 


piyi+y'j+y'k)-^:.. 

(p- 2)(p-l) 


(4-24) 


donde las primas indican los totales del renglon, la columna y el tratamiento con el valor faltante, y y' es 
el gran total con el valor faltante. 

Los cuadrados latinos pueden ser titiles en situaciones en las que los renglones y las columnas repre- 
sentan los factores que el experimentador en realidad quiere estudiar y en las que no hay restricciones so- 
bre la aleatorizacidn. Por lo tanto, los tres factores (renglones, columnas y letras), cada uno con p niveles, 
pueden investigate en sdlo p 2 corridas. En este diseno se supone que no existe interaccidn entre los facto- 
res. Se abundard mds adelante sobre el tema de la interaccidn. 


Replicas de cuadrados latinos 

Una desventaja de los cuadrados latinos pequenos es que proporcionan un numero relativamente peque- 
no de grados de libertad del error. Por ejemplo, un cuadrado latino 3x3 sdlo tiene dos grados de libertad 
del error, un cuadrado latino 4x4 sdlo tiene seis grados de libertad del error, etc. Cuando se usan cua- 
drados latinos pequenos, con ffecuencia es deseable hacer replicas de los mismos para incrementar los 
grados de libertad del error. 
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Tabla 4^14 Anllisis de varianza de un cuadrado latino con replicas, caso 1 


Fuente de Grados de 

variacibn Suma de cuadrados libertad Cuadrado medio F 0 


Tlatamientos 

-St 2 

y 1 ... 

N 

P-1 

P~ 1 

MS 

i n * J 7‘ratamieniOs 

MS e 

Renglones 

"Pm 

y 2 ... 

N 

P-1 

‘’^Renglones 

P~ 1 


Columnas 

1 p 

— S y\. 

n Pl% 

y 2 ... 

N 

P~ 1 

CO 

Columnar 

P~ 1 


Replicas 

1 2 
-jl 

r /^i 

yl 

N 

n- 1 

*^R£plicas 

n —1 






SS E 


Error 

Sustraccibn 

<p-l)[i.<p + l)-3] 

(/>-l)K/>+l)-3] 


Tbtal 

SSSS y& 

np 2 - 1 




Existen varias maneras de hacer replicas de un cuadrado latino, Para ilustrar este punto, suponga que 
se hacen n replicas del cuadrado latino 5x5 utilizado en el ejemplo 4-3. Esto podrfa haberse hecho de la 
manera siguiente: 

1. Usando los mismos lotes y operadores en cada rdplica, 

2. Usando los mismos lotes pero operadores diferentes en cada rbplica (o, de manera equivalente, 
usando los mismos operadores pero lotes diferentes). 

3. Usando diferentes lotes y diferentes operadores. 

El an£lisis de varianza depende del mbtodo utilizado para hacer las replicas. 

Considere el caso 1, donde en cada replica se usan los mismos niveles de los factores para la formation 
de bloques en los renglones y las columnas. Seay^ la observacibn del renglbn i, el tratamiento j, la columna 
fcyla rdplica /. Hay en total N = np 2 observaciones. El an&lisis de varianza se resume en la tabla 4-14. 

Considere ahora el caso 2 y suponga que en cada rbplica se usan nuevos lotes de materia prima pero 
los mismos operadores, Por lo tanto, hay ahora cinco nuevos renglones (en general, p nuevos renglones) 


Tabla 4-15 An&lisis de varianza de un cuadrado latino con replicas, caso 2 


Fuente de 
variacibn 


Suma de cuadrados 


Grados de 
libertad 


Cuadrado medio 


Tlatamientos 

-± y 2 - y - 
npfi N 

P~ 1 

SS 

^Tntamientos 

P-l 

^f^Traiamientos 

ms e 

Renglones 

1 n P n 2 

l p 22yL-2h 

nip- 1) 

ss 

KJ ' ^Renglones 

n(p-l) 


Columnas 

Ly y i _zl 

npfe N 

P-1 

SS 

Column as 

P-l 


Replicas 

1 n 2 

i v , y 

P 2 & yj N 

n- 1 

SS 

JJ R£pUcas 

n —1 





SS E 


Error 

Sustraccibn 

(P-I)(n p-l) 

(p-l)(np-l) 


Tbtal 

i j k 1 JV 

np 2 - 1 
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Tabla 4-16 An&lisis de varianza de un cuadrado latino con replicas, caso 3 

Fuente de 
variacidn 

Suma de cuadrados 

Grados de 
libertad 

Cuadrado medio 

F o 

Tratamientos 

J_y y » _yl 

npfZ N 

p - 1 

^Tratamientos 

P 1 

^^Tratamientos 

MS e 

Renglones 

1 n p n 2 

n(p-l) 

‘^‘^Renglones 

n(p-l) 


Columnas 

1 n P n 2 

P t = i k=\ /^i P 

nip- 1) 

^ ^Columnas 

n (P~ 1) 


Rdplicas 

-LV _Zl 

/ h y ' v 

n- 1 

^^Replica-s 

n —1 


Error 

Sustraccidn 

<p-l)[nG>-l)-l] 

ss E 


(p-l)[n(p-l)-l] 


Total 

SEED y» 

i j k i 

np 2 - 1 




dentro de cada replica. El an41isis de varianza se resume en la tabla 4-15. Observe que la fuente de varia- 
cidn de los renglones mide en realidad la variation entre los renglones dentro de las n replicas. 

Por ultimo, considere el caso 3, donde se usan nuevos lotes de materia prima y nuevos operadores en 
cada rdplica. Ahora la variacidn que resulta tanto de los renglones como de las columnas mide la varia- 
cidn que resulta de estos factores dentro de las rdplicas. El analisis de varianza se resume en la tabla 4-16. 

Hay otros enfoques para analizar cuadrados latinos con replicas que permiten la presencia de algu- 
nas interacciones entre tratamientos y cuadrados (referirse al problema 4-19). 

Disenos altemados y disenos balanceados para efectos residuales 

Ocasionalmente aparece un problema en el que los periodos son uno de los factores del experimento. En 
general, hay p tratamientos que deben probarse en p periodos utilizando np unidades experimentales. Por 
ejemplo, un analista del desempeno humano estd estudiando el efecto de dos fluidos de restitucion para 
la deshidratacion en 20 sujetos. En el primer periodo, a la mitad de los sujetos (elegidos al azar) se le ad- 
ministra el fluido A y a la otra mitad el fluido B. Al termino del periodo se mide la respuesta, y se deja 
transcurrir un lapso en el que se elimina cualquier efecto fisiologico de los fluidos. Despues el experimen- 
tador hace que los sujetos que tomaron el fluido /I tomen el fluido B y aquellos que tomaron el fluido B to- 
men el fluido ^4. A este diseno se le llama diseiio alternado o entrecruzado. Se analiza como un conjunto 
de 10 cuadrados latinos con dos renglones (los periodos) y dos tratamientos (los tipos de fluido). Las dos 
columnas en cada uno de los 10 cuadrados corresponden a los sujetos. 

En la figura 4-7 se muestra la disposici6n de este diseno. Observe que los renglones del cuadrado lati- 
no representan a los periodos y que las columnas representan a los sujetos. Los 10 sujetos que recibieron 
primero el fluido A (1, 4, 6, 7, 9, 12, 13, 15, 17 y 19) se determinaron al azar. 


Cuadrados latinos 




I 


II 

III 

IV 


V 

VI 

VII 

VIII 

IX 

X 

Sujeto 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

n 

12 

13 

14 

15 

16 

17 

18 

19 

20 

Periodo 1 

A 

B 

B 

A 

B 

A 

A 

B 

A 

B 

B 

A 

A 

B 

A 

B 

A 

B 

A 

B 

Periodo 2 

B 

A 

A 

B 

A 

B 

B 

A 

B 

A 

A 

B 

B 

A 

B 

A 

B 

A 

B 

A 


Figura 4-7 Un diseno alternado. 
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labia 4-17 An&lisis de varianza 


del disefto altemado de la 
figura 4-7 


Fuente de 
variation 

Grados de 
libertad 

Sujetos (columnas) 

19 

Periodos (renglones) 

1 

Fluidos (letras) 

1 

Error 

18 

Total 

39 


En la tabla 4-17 se resume un analisis de varianza. La suma de cuadrados de los sujetos se calcula 
como la suma de cuadrados entre los totales de los 20 sujetos corregida, la suma de cuadrados de los pe- 
riodos es la suma de cuadrados entre los renglones corregida, y la suma de cuadrados de los fluidos se cal- 
cula como la suma de cuadrados entre los totales de las letras corregida. Para m&s detalles del analisis 
estadistico de estos disenos, ver Cochran y Cox [26], John [61d] y Anderson y McLean [2]. 

Thmbi6n es posible emplear disenos tipo cuadrado latino para experimentos en los que los tratamien- 
tos tienen un efecto residual; es decir, por ejemplo, si los datos del fluidoB en el periodo 2 siguen reflejan- 
do algun efecto del fluido A tornado en el periodo 1. En Cochran y Cox [26] y John [61d] se estudian en 
detalle los disenos balanceados para efectos residuales. 


4-3 DISENO DE CUADRADO GRECOLATINO 

Considere un cuadrado latino p x p al cual se le superpone un segundo cuadrado latino p x p en el que 
los tratamientos se denotan con letras griegas. Si cuando se hace la superposition los dos cuadrados tie- 
nen la propiedad de que cada letra griega aparece una y sdlo una vez con cada letra latina, se dice que los 
dos cuadrados latinos son ortogonales , y al diseno obtenido se le llama cuadrado grecolatino. En la tabla 
4-18 se muestra un ejemplo de un cuadrado grecolatino 4x4. 

El diseno de cuadrado grecolatino puede usarse para controlar sistem&ticamente tres fuentes de va- 
riabilidad extraha, es decir, para hacer la formacidn de bloques en tres direcciones. El diseno permite la 
investigacidn de cuatro factores (renglones, columnas, letras latinas y letras griegas), cada una con p nive- 
les en s61o p 2 corridas. Existen cuadrados grecolatinos para toda p > 3, excepto p = 6. 


Tabla 4-18 Disefio del cuadrado grecolatino 4x4 


Columna 


Rengldn 

1 

2 

3 

4 

1 

Aa 

Bp 

Cy 

Dd 

2 

Bd 

Ay 

W 

Ca 

3 

C/J 

Da 

Ad 

By 

4 

Dy 

Cd 

Ba 

Aft 
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Tabla 4-19 AnSlisis de varianza de un disefto del cuadrado grecolatino 


Fuente de variacidn 

Suma de cuadrados 

Grados de libertad 

Tratamientos con letras latinas 

4 

p-1 

TTatamientos con letras griegas 

SS ° = -p% y2jt ~ y ~N 

p - 1 

Renglones 

^Renglones — _ a t 

P i*l iV 

p - 1 

Columnas 

1 P 

cc „ V 2 ^ 

^ ^Columnas ^ / j ^ 

p - 1 

Error 

SS E (por sustraccidn) 

(p - 3)(p - 1) 

Tbtal 

SS T y W 

ijkl ^ 

P 2 - 1 


El modelo estadistico para el diseno de cuadrado grecolatino es 

i = 1, 2 ,..., p 


yw=v+ 9 i +T i +( 0 * + Vi +£ 


ijkl 


1 = 1, 2,..., p 

k = 1, 2,..., p 

[1 = 1, 2,..., p 


(4-25) 


dondejtya es la observacidn del rengldn i y la columna / para la letra latina j y la letra griega k, 0, es el efecto 
del rengldn i-dsimo, t j es el efecto del tratamiento de letra latina co k es el efecto del tratamiento de letra 
griega k, W, es el efecto de la columna /, y E m es un componente NID(0, o 2 ) del error aleatorio. S61o son 
necesarios dos de los cuatro subindices para identificar completamente una observacidn. 

El analisis de varianza es muy parecido al de un cuadrado latino. Puesto que las letras griegas apare- 
cen exactamente una vez en cada renglon y columna, y exactamente una vez con cada letra latina, el factor 
representado por las letras griegas es ortogonal a los renglones, las columnas y los tratamientos de letras 
latinas. Por lo tanto, puede calcularse una suma de cuadrados debida al factor de las letras griegas a partir 
de los totales de las letras griegas y el error experimental se reduce adicionalmente en esta cantidad. En la 
tabla 4-19 se ilustran los detalles de los calculos. La hipotesis nula de la iguald&d de tratamientos de ren- 
glones, columnas, letras latinas y letras griegas, se probaria dividiendo el cuadrado medio correspondien- 
te por el cuadrado medio del error. La region de rechazo es la cola superior del punto de la distribution 

Fp-i, (p-3)(p-iy 


EJEMPLO 4-4 

Suponga que en el experimento de la carga propulsora del ejemplo 4-3 un factor adicional, los montajes 
de prueba, podrfa ser importante. Sea que haya cinco montajes de prueba denotados por las letras griegas 
a, y e. En la tabla 4-20 se muestra el diseno de cuadrado grecolatino 5x5 resultante. 

Observe que, debido a que los totales de los lotes de materia prima (renglones), los operadores (co- 
lumnas) y las formulaciones (letras latinas) son identicos a los del ejemplo 4-3, se tiene 

55^ = 68.00 = 150.00 y 55 ForaiulS£iones = 330.00 
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Tabla 4-20 Disefio del cuadrado grecolatino para el problema de la carga propulsora 


Lotesde 
materia prima 



Operadores 




1 

2 

3 

4 

5 

1 

Aa = -I 

By =~5 

Ce - -6 

Dft =-l 

Ed =-l 

-14 

2 

BP = -8 

Cd = -1 

Da = 5 

Ey — 2 

Ae -11 

9 

3 

Cy = -7 

De = 13 

Eft = 1 

AS = 2 

Ba a* -4 

5 

4 

Dd - 1 

Ea = 6 

Ay = 1 

Be =-2 

Cft = -3 

3 

5 

Ee = -3 

Aft = 5 

B6 =-5 

Ca = 4 

Dy = 6 

7 

y.j 

-18 

18 

-4 

5 

9 

10 - x. 


Los totales de los montajes de prueba (las letras griegas) son 


Letra griega 

Total de la prueba de ensamblaje 

a 

X.1.= 10 

p 

y..2.= -6 

r 

T-J. = -3 

6 

1 

II 

£ 

y.5. = 13 


Por lo tanto, la suma de cuadrados debida a los montajes de prueba es 

cc _Iy ^ _zL 
“***• pik y * n 

= i[10 2 +(-6) ! +(-3)’ +(— 4) 1 +13 ! ]-“_= 6Z00 

J w 

En la tabla 4-21 se resume el antilisis de varianza complete. Las formulaciones son diferentes significati- 
vamente en 1%. A1 comparar las tablas 4-21 y 4-12, se observa que al sacar la variabilidad debida a los 
montajes de prueba, el error experimental disminuye. Sin embargo, al disminuir el error experimental, se 
han reducido tambidn los grados de libertad de 12 (en el diseno del cuadrado latino del ejemplo 4-3) a 8. 
Por lo tanto, la estimacion del error tiene menos grados de libertad, y la prueba puede ser menos sensible. 


Tabla 4-21 Anilisis de varianza del problema de la carga propulsora 


Fuente de variacidn 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

F o 

Valor P 

Formulaciones 

330.00 

4 

82.50 

10.00 

0.0033 

Lotes de materia prima 

68.00 

4 

17.00 



Operadores 

150.00 

4 

37.50 



Montajes de la prueba 

62.00 

4 

15.50 



Error 

66.00 

8 

8.25 



Idtal 

676.00 

24 
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Puede hacerse cierta ampliacibn del concepto de los pares ortogonales de cuadrados latinos que for- 
man un cuadrado grecolatino. Un hipercuadrado p x p es un diseno en el que se superponen tres o m£s 
cuadrados latinos ortogonales p x p. En general, hasta p - hi factores podrfan estudiarse si se dispone de 
un corijunto completo dep-1 cuadrados latinos ortogonales. En este diseno se utilizarfan todos los (p + 
1 )(p - 1) = p 2 - 1 grados de libertad, por lo que se necesita una estimacibn independiente de la varianza 
del error. Desde luego, no debe haber interacciones entre los factores cuando se usan hipercuadrados. 


4-4 DISENOS DE BLOQUES INCOMPLETOS BALANCEADOS 

En ciertos experimentos en los que se utilizan disenos de bloques aleatorizados quizd no sea posible co- 
rrer todas las combinaciones de los tratamientos en cada bloque, Situaciones como bsta ocurren general- 
mente por limitaciones del aparato experimental o de las instalaciones o por el tamano fisico del bloque. 
Por ejemplo, en el experimento de la prueba de la dureza (ejemplo 4-1), suponga que debido a sus dimen- 
siones cada ejemplar de prueba s61o puede usarse para probar tres puntas. Por lo tanto, no es posible pro- 
bar todas las puntas en cada uno de los ejemplares. Para este tipo de problema es posible utilizar disenos 
de bloques aleatorizados en los que cada tratamiento no esta presente en cada bloque. Estos disenos se 
conocen como disenos de bloques incompletos aleatorizados. 

Cuando las comparaciones de todos los tratamientos son igualmente importantes, las combinaciones 
de los tratamientos usadas en cada bloque deberan seleccionarse en una forma balanceada, es decir, de 
tal manera que cualquier par de tratamientos ocurra conjuntamente el mismo numero de veces que cual- 
quier otro par. Por lo tanto, un diseno de bloques incompletos balanceados (BIBD, balanced incomplete 
block design) es un diseno de bloques incompletos en el que dos tratamientos cualesquiera aparecen con- 
juntamente el mismo numero de veces. Suponga que hay a tratamientos y que cada bloque puede conte- 
ner exactamente k (k < a) tratamientos. Un diseno de bloques incompletos balanceados puede 
construirse tomando (£ ) bloques y asignando una combinacibn de tratamientos diferente a cada bloque. 
Con frecuencia, sin embargo, puede obtenerse un diseno balanceado con menos de ( J ) bloques. Thblas de 
BIBD se proporcionan en Fisher y Yates [45], Davies [36] y Cochran y Cox [26]. 

Como un ejemplo, suponga que un ingeniero quimico piensa que el tiempo de reaccibn de un proceso 
quimico es una funcion del tipo de catalizador empleado. Se est£n investigando cuatro catalizadores. El 
procedimiento experimental consiste en seleccionar un lote de materia prima, cargar la planta piloto, 
aplicar cada catalizador en una corrida separada de la planta piloto y observar el tiempo de reaccibn, De- 
bido a que las variaciones en los lotes de materia prima pueden afectar el desempeno de los catalizadores, 
el ingeniero decide usar los lotes de materia prima como bloques. Sin embargo, cada lote es apenas lo su- 
ficientemente grande para permitir que se prueben tres catalizadores. Por lo tanto, debe usarse un diseno 


Tabla 4-22 Disefio de bloques incompletos balanceados para el 
experimento del catalizador 


Tfatamiento 

(catalizador) 

Bloque (lote de materia prima) 

y,. 

1 

2 

3 

4 

1 

73 

74 

_ 

71 

218 

2 

— 

75 

67 

72 

214 

3 

73 

75 

68 

- 

216 

4 

75 

- 

72 

75 

222 

yj 

221 

224 

207 

218 

870= 
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de bloques incompletos aleatorizados. El diseno de bloques incompletos balanceados para este experi- 
mento, junto con las observaciones registradas, se muestran en la tabla 4-22. El orden en que se corren los 
catalizadores en cada bloque est& aleatorizado. 


4-4.1 Andlisis estadistico del diseno de bloques incompletos balanceados 

Como de costumbre, se supone que hay a tratamientos y b bloques. Ademas, se supone que cada bloque 
contiene k tratamientos, que cada tratamiento ocurre r veces en el diseno (o que se hacen r replicas del 
mismo), y que hay N = ar = bk observaciones en total. Asimismo, el numero de veces que cada par de tra- 
tamientos aparece en el mismo bloque es 

e-1 

Si a - b, se dice que el diseno es simttrico. 

El parametroA debe serun entero. Para deducir la relacidn para A, considere cualquier tratamiento, 
por ejemplo el tratamiento 1. Puesto que el tratamiento 1 aparece en r bloques y hay otros k - 1 tratamien- 
tos en cada uno de esos bloques, hay r(k - 1) observaciones en un bloque que contiene al tratamiento 1. 
Estas r(Jfc - 1) observaciones tambien tienen que representar a los a - 1 tratamientos restantes A veces. Por 
lo tanto, A(a - 1) = r(k - 1). 

El modelo estadistico del BIBD es 

y.. = fi+Ti+fij+E^ (4-26) 

dondey.y es la observacidn i-esima en el bloque y-esimo, /z es la media global, r, es el efecto del tratamiento 
j-esimo, es el efecto del bloque y-6simo, y e v es el componente NID(0, o 2 ) del error aleatorio. La variabi- 
lidad total en los datos se expresa por la suma de cuadrados totales corregida: 

< 4 ' 27 > 

i j 

Puede hacerse la particidn de la variabilidad total en 

S$T ‘^^Tratamientos(ajustadoS) Bloques 

donde la suma de cuadrados de los tratamientos est& ajustada para separar los efectos de los tratamientos 
y de los bloques. Este ajuste es necesario porque cada tratamiento esta representado en un conjunto dife- 
rente de r bloques. Por lo tanto, las diferencias entre los totales de los tratamientos no ajustadosy! .,y 2 ., 
y a tambi6n son afectadas por las diferencias entre los bloques. 

La suma de cuadrados de los bloques es 

(4 - 28) 

donde y ; es el total del bloque y'-6simo. 55 Bloques tiene b- 1 grados de libertad. La suma de cuadrados de los 
tratamientos ajustada es 

k±Q? 

ss = — — 

Tratnnuento^ajustados) -j 


(4-29) 
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Tabla 4-23 An£lisis de varianza del disefio de bloques incompletos balance ados 


Fuente de 
vaiiacidn 

Suma de cuadrados 

Grados de 
libertad 

Cuadrado medio 

F o 

Tratamientos 

(ajustados) 

Xa 

a-l 

cc 

^Tratamientofi(ajustados) 

a-l 

r ^^Tratamientosfajustados) 

#_ MS e 

Bloques 

ly 

k Zj *■> N 

b-l 

^^Bloques 

b~ 1 


Error 

SS E (por sustraccidn) 

N-a-b 4* 1 

SS E 

N-a-b + 1 


Total 

22rf-£ 

N- 1 




donde Q { es el total ajustado del tratamiento /-6simo, el cual se calcula como 

1 b 

Qi = y L - r 2 "f y.j 1 = 1,2,..., a (4-30) 

K i = i 


con n t j = 1 si el tratamiento i aparece en el bloque j y n tj = 0 en caso contrario. Los totales de los tratamien- 
tos ajustados siempre sumarSn cero. SS toti ^ entosWrattd05) tiene a - 1 grados de libertad. La suma de cuadra- 
dos del error se calcula por sustraccidn como 


CC _ CC _ CC _ PC 

E Tratamientos( ajustados) Bloques 


(4-31) 


y tiene N - a - b + 1 grados de libertad. 

El estadistico apropiado para probar la igualdad de los efectos de los tratamientos es 

MS, 


Fo=- 


J T ratamie Atos(ajustados) 

MS, 


En la tabla 4-23 se resume el analisis de varianza. 


EJEMPLO 4-5 

Considere los datos de la tabla 4-22 para el experimento del catalizador. Se trata de un BIBD con a = 4, 
b ~ 4,/c = 3,r = 3,A = 2yN= 12.E1 analisis de estos datos es el siguiente. La suma de cuadrados total es 

= 6il56-I5Z211 =8 i.oo 
12 


La suma de cuadrados de los bloques se encuentra con la ecuacion 4-28 como 


SS, 


Bloques 


1 4 v 2 

=~y y.-iL 
y > 12 


j=i 


= i[(221 y +(207) 2 +(224) 2 +(218) 2 ]- ^ 87< ^ =55.00 

J l^r 


12 
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4^24 An£lisis de varianza del eiemplo 4'5 

Fuente de variacidn 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

F o 

Valor P 

Ttatamientos (ajustados 
para los bloques) 

Bloques 

Error 

Tbtal 

22.75 

55.00 

3.25 

81.00 

3 

3 

5 

11 

7.58 

0.65 

11.66 

0.0107 


Para calcular la suma de cuadrados de los tratamientos ajustados para los bloques, primero se determinan 
los totales de los tratamientos ajustados utilizando la ecuacion 4-30 como 

Q i = (218)- ^(221 + 224 + 218) = -9/ 3 
Q 2 =(214)-i(207+ 224 + 218) = -7/3 

0 3 =(216)- ±(221+207 + 224) = -4/ 3 

0 4 = (222)— y (221 + 207 + 218)= 20/ 3 

La suma de cuadrados de los tratamientos ajustados se calcula con la ecuacibn 4-29 como 

*2 Qi 

cc = — — 

Tratamientos ajustados) ^ 

_ 3[(-9/3) 2 +(-7/ 3) 2 +(-4/ 3) 2 +(20/ 3) 2 ] = 

" (2X4) 


La suma de cuadrados del error se obtiene por sustraccibn como 

SS E SSj- *^*^Tt»tanjieiito6(ajiMtadoe) ^^BloqaoB 

= 81.00 - 2275- 55.00 = 325 

En la tabla 4-24 se muestra el antdisis de varianza. Puesto que el valor P es pequeno, se concluye que el ca- 
talizador empleado tiene un efecto significativo sobre el tiempo de reaccibn. 


Si el factor bajo estudio es fijo, las pruebas para las medias de tratamientos individuales pueden ser 
de interbs. Si se emplean contrastes ortogonales, los contrastes deben hacerse sobre los totales de los tra- 
tamientos ajustados, las {0,} en lugar de las (yj. La suma de cuadrados de los contrastes es 



l-l 


donde {c,} son los coeficientes de los contrastes. Pueden usarse otros metodos de comparacibn multiple 
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para comparar todos los pares de efectos de los tratamientos ajustados (section 4-4.2), los cuales se esti- 
man con i. = kQJiXa). El error estandar del efecto de un tratamiento ajustado es 


5 = 


kMS E 

Xa 


(4-32) 


En el analisis que acaba de describirse, se ha hecho la particion de la suma de cuadrados total en una 
suma de cuadrados de los tratamientos ajustados, una suma de cuadrados de los bloques sin ajuste y una 
suma de cuadrados del error. En ocasiones habria interes en evaluar los efectos de los bloques. Para ello 
se requiere hacer una particion alternativa de 55^ es decir, 

SS r ~ ^^Tratamientos 4" ‘^‘^Bloques(ajustados) 4“ SS E 

Aquf, 55 nalami(;nlos esth sin ajuste. Si el diseno es sinietrico, es decir, si a = b, puede obtenerse una formula 
simple para 55 Bloqaes(ajustados) . Los totales de los bloques ajustados son 

Qj^y.J-z'Z ;' = 1> 2, . . ., 6 (4-33) 

' /=! 


y 


r2 (Q'i) 2 

SS = ; " 1 

u Bloqucs(ajustados) 

El BIBD del ejemplo 4-5 es simOtrico porque a = b = 4. Por lo tanto, 

Q; = (221)-i(218+ 216 + 222)= 7/3 
e; =(224) -4 (218+ 214 +216) =24/ 3 
e; = (207)— 4(214+216+222) = -31/3 
e; = (218) -4 (218+ 214 +222)= 0 


y 


ss 


Bloque6(ajustados) 


3[(7 / 3) 2 +(24/ 3) 2 +(-31 / 3) 2 +(0) 2 ] 
(2)(4) 


= 66.08 


Asimismo, 


(4-34) 


55. 


Tratamientos 


(218) 2 +(214) 2 +(216) 2 +(222) 2 (870) 2 


12 


= 11.67 


labia 4-25 Analisis de varianza del ejemplo 4-5, incluyendo tanto los tratamientos como los bloques 

Soma de Grados de Cuadrado 


Fuente de variacidn 

cuadrados 

libertad 

medio 

F o 

Valor P 

Tratamientos (ajustados) 

22.75 

3 

7,58 

11.66 

0.0107 

Tratamientos (sin ajuste) 

11.67 

3 



Bloques (sin ajuste) 

55.00 

3 




Bloques (ajustados) 

66.08 

3 

22.03 

33.90 

0.0010 

Error 

3.25 

5 

0.65 


Tbtal 

81.0 

11 
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En la tabla 4-25 se presenta un resumen del an&lisis de varianza del BIBD simbtrico. Observe que las 
sumas de cuadrados asociadas con los cuadrados medios de la tabla 4-25 no producen la suma de cuadra- 
dos total, es decir, 

SSj 9* ‘^‘^Tratamientos(ajustados) ^^Bloque^ajustados) 

Esto es consecuencia del car£cter no ortogonal de los tratamientos y los bloques. 


Salida de computadora 

Existen varios paquetes de computadora que realizar£n el an^lisis de un diseno de bloques incompletos 
balanceados. El procedimiento de Modelos Lineales Generales (General Linear Models) del SAS es uno 
de ellos, y Minitab, un paquete de estadistica para computadoras personales de uso generalizado, es otro. 
La parte superior de la tabla 4-26 es la salida del procedimiento de Modelos Lineales Generales de Mini- 
tab para el ejemplo 4-5. A1 comparar las tablas 4-26 y 4-25, se observa que Minitab ha calculado la suma 
de cuadrados de los tratamientos ajustados y la suma de cuadrados de los bloques ajustados (en la salida 
de Minitab se les llama “AdjSS” o SS ajustada). 

La parte inferior de la tabla 4-26 es un an£lisis de comparaciones multiples, en el que se utiliza el m6- 
todo de Thkey. Se presentan los intervalos de confianza para las diferencias de todos los pares de medias y 
la prueba de Thkey. Observe que el mbtodo de Thkey llevaria a la conclusibn de que el catalizador 4 es di- 
ferente de los otros tres. 


4-4*2 Estimaci6n de mmirnos cuadrados de los par&metros 

Considere la estimacibn de los efectos de los tratamientos en el modelo BIBD, Las ecuaciones normales 
de minimos cuadrados son 

a b 

fiiNji+r^ h~y- 

Tjtijft+rt, +5J n^fSj = y L i = 1, 2,..., a (4-35) 

y=i 

0r&+'2, +k &i = y.j i =1> 2 >-’ b 

i=i 

A1 imponer las restricciones = 0, se encuentra que ft = j> , Adem&s, al utilizar las ecuaciones 

para {fy} para eliminar los efectos de los bloques de las ecuaciones para {rj, se obtiene 

r** t - /t, - X X WpjK = ~ E n v y> ( 4 - 36 ) 

j=i P = i j=i 

pxi 

Observe que el miembro del lado derecho de la ecuacion 4-36 es kQ t , donde Q t es el total del tratamiento 
ajustado i'-6simo (ver la ecuacibn 4-29). Entonces, puesto que = X sip * i y n 2 pj = n pj (ya que n pJ = 

0 o 1), la ecuacidn 4-36 puede reescribirse como 

r{k~ l)^i i P = k Qi 

P~ 1 

P*i 


i = 1 , 2 ,..., a 


(4-37) 



labia 4-26 An&lisis de Mlnltab (Modelo Lineal General) para el ejemplo 4-5 


Modelo Lineal General 

Factor Type Levels Values 

Catalyst fixed 41234 

Block fixed 41234 


Analysis of Variance for Time, using Adjusted SS for Tests 


Source 

DF Seq SS Adj SS 

Adj MS 

F 

P 


Cata Lyst 

3 11.667 22.750 

7.583 

11.67 

0.011 


Block 

3 66.083 66.083 

22.028 

33.89 

0.001 


Error 

5 3.250 3.250 

0.650 




Total 

11 81.000 





Tukey 95. 

0% Simultaneous Confidence 

Intervals 




Response 

Variable Time 





All Pairwise Comparisons among Levels of Catalyst 



Catalyst 

= 1 subtracted from: 





Catalyst 

Lower Center Upper 


-+ 



2 

-2.327 0.2500 2.827 

( 


) 


3 

-1.952 0.6250 3.202 

C 

— »*— 

) 


4 

1.048 3.6250 6.202 


( 


) 










0.0 

2.5 

5.0 


Catalyst 

- 2 subtracted from: 






Catalyst 

Lower 

Center 

Upper 





3 

-2.202 

0.3750 

2.952 

( 


) 


4 

0.798 

3.3750 

5.952 

— 

1 1 

1 1 

I 

1 

1 o 
+ ■ 

1 o 
1 

1 

1 

1 

2.5 

) 

5.0 


Catalyst = 

3 subtracted from: 





Catalyst 

4 

Lower Center 

0.4228 3.000 

Upper 

5.577 



1) 




0.0 

2.5 

s!o 


Tukey Simultaneous Tests 
Response Variable Time 

All Pairwise Comparisons among Levels of Catalyst 


Cata Lyst 


1 subtracted from: 


Leve l 
Cata lyst 
2 

3 

4 


Di f f erence 
of Means 
0.2500 
0.6250 
3.6250 


SE of 
Di ff erence 
0.6982 
0.6982 
0.6982 


Adjusted 
T“Value P-Value 

0.3581 0.9825 

0.8951 0.8085 

5.1918 0.0130 


Catalyst 


2 subtracted from: 


Leve l 
Catalyst 

3 

4 


Difference 
of Means 
0.3750 
3.3750 


SE of 
Di ff erence 
0.6982 
0.6982 


T-Value 

0.5371 

4.8338 


Adjusted 
P-Va Lue 
0.9462 
0.0175 


Cata lyst 


3 subtracted from: 


Level 
Cata Lyst 
4 


Difference SE of 

of Means Difference 
3.000 0.6982 


Adjusted 
T-Value P-VaLue 
4.297 0.0281 
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Por ultimo, observe que la restriccidn 2? =1 f , - 0 implica que 2" =1 t p = -t, y recuerde que r(k - 1) = A(a - 
1), de donde se obtiene p *‘ 

fat, = kQi i = 1, 2,..., a (4-38) 

Por lo tanto, los estimadores de minimos cuadrados de los efectos de los tratamientos en el modelo de 
bloques iiicompletos balanceados son 

»■-£ (4 - 39) 


Como una ilustracidn, considere el BIBD del ejemplo 4-5. Puesto que Qj = -9/3, Q 2 = -7/3, Q 3 = -4/3 
y 04 = 20/3, se obtiene 


_ 3(-9/3) _ _ 3(-7/ 3) _ 

(2)(4) - 9/8 (2K«) 7/8 

, . 3(-4/3). 3(20/3) 

f >-l2M4T- 4/8 ''-(f)'”'' 


como se encontrd en la seccidn 4-4.1. 


4-4.3 Recuperacidn de informaci6n interbloques en el diseno 
de bloques incompletos balanceados 

A1 an&lisis del BIBD presentado en la secci6n 4-4.1 suele llamarsele el an£lisis intrabloques porque las 
diferendas de los bloques se eliminan y todos los contrastes de los efectos de los tratamientos pueden ex- 
presarse como comparaciones entre las observaciones del mismo bloque. Este an&lisis es apropiado inde- 
pendientemente de si los bloques son fijos o aleatorios. Yates [113c] senald que si los efectos de los 
bloques son variables aleatorias no correlacionadas con medias cero y varianza a \ , es posible obtener in- 
formaddn adicional acerca de los efectos de los tratamientos r f . Yates llam6 an&lisis interbloques al m6- 
todo para obtener esta informaddn adicional. 

Considere los totales de los bloques y v como una coleccidn de b observadones. El modelo para estas 
observaciones (siguiendo a John [61d]) es 

a / a \ 

y.j =^ + 2 n a x > + + S £ V ( 44 °) 

1=1 V 1=1 / 

donde el tdrmino entre par£ntesis puede considerarse como el error. Los estimadores interbloques de/<y 
r, se encuentran minimiz ando la fund6n de minimos cuadrados 

i- l (*"*“§ V, 1 

Se obtienen as! las siguientes ecuadones normales de minimos cuadrados: 

a 

fiiNfl+r^ f. = y 

i " 1 . » (4*41) 

t i :kr/i+rf i r p = 2 n,*, * = 1, 2,..., a 

P ~ 1 J" 1 

p*i 
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donde ju y r , denotan los estimadores interbloques. A1 imponer la restriccidn 2“ =1 £, = 0, se obtienen las 
soluciones de las ecuaciones 4-41 como 


n = y.. 

(4-42) 

b 

2 n ny.i-ky.. 

1 i = l, 2,..., a 

r-X 

(4-43) 


Es posible demostrar que los estimadores interbloques (r, } y los estimadores intrabloques {i . } no est£n 
correlacionados. 

Los estimadores interbloques {r, } pueden diferir de los estimadores intrabloques {t,. }. Por ejemplo, 
los estimadores interbloques para el BIBD del ejemplo 4-5 se calculan de la siguiente manera: 

?i = 663-(3X3)(72.50) = 1050 
, 2 = 649-(3)(3X72.50) = _ a50 
i 3 = 652— (3)(3)(72.50) _ _ Q 5Q 
646-(3X3)(72.50)_ 650 

4 'l— O 


Observe que los valores de 2* =1 n # y se usaron en la p&gina 157 para calcular los totales de los tratamien- 
tos ajustados en el an&lisis intrabloques. 

Suponga ahora que quieren combinarse los estimadores interbloques e intrabloques para obtener 
una sola estimacidn de la varianza minima insesgada de cada r,. Es posible demostrar que i . y f , son inses- 
gados y tambien que 

V(i . ) = ^^2 ~~ ° 1 (intrabloques) 


y 


V(h) = 


fc(a — 1) 
a(r- X) 


( o 2 +ka ]) 


(intrabloques) 


Se usa una combinacidn lineal de los dos estimadores, por ejemplo 


r 


a 1 i i +a 2 t i 


(4-44) 


para estimar r ; . En este m6todo de estimation, el estimador combinado insesgado de la varianza minima 
r* debera tener las ponderaciones a x = uj(u x + u 2 ) y a 2 = u 2 /{u l + u 2 ), donde u, = W(r ; )yw 2 = 1/K(r, ). 
Por lo tanto, las ponderaciones 6ptimas son inversamente proporcionales a las varianzas de r, y r . . Esto 
implica que el mejor estimador combinado es 





i = l, 2,..., a 
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que puede simplificarse como 


/ * 


kQ.(a 2 +ko}) + 


r. = ■ 


2 nyy.j-by.. k 

V/-1 / 


(r-2)cr +Aa(<7 2 +fct7^) 


i = 1, 2 ,..., a 


(4-45) 


Desafortunadamente, la ecuacidn 4-45 no puede usarse para estimar r, porque no se conocen las va- 
rianzas a 2 y . El enfoque comun es estimar cry a 2 a partir de los datos y sustituir estos par&metros de la 
ecuacion 4-45 con las estimaciones. La estimacion que suele tomarse para o 2 es el cuadrado medio del 
error del an&lisis de varianza intrabloques, o el error intrabloques. Por lo tanto. 


La estimacion de a 2 , se encuentra a partir del cuadrado medio de los bloques ajustados para los trata- 
mientos. En general, para un diseno de bloques incompletos balanceados, este cuadrado medio es 




ka 


b 

M 


MS, 


Ll 

k 


a 

-2 


Bloques( ajustados) 


I (P- 1) 


K 

r 


(4-46) 


y su valor esperado (cuya deduction se hace en Graybill [50]) es 

^^BlOquc^justad™) 


_ , a(r-l) 2 


Por lo tanto, si MS BloqueHajU5U(los) > MS E , la estimacion de dj es 

[3L^Bloques(ajusl»dm) — MS g ](b~ 1) 




a(r-l) 


(4-47) 


y si M5 Bloques(ajustados) < MS e , se hace a 2 = 0. Esto resulta en el estimador combinado 


r. = 


kQXa 2 +kd\)+ ^ n (J y ; - kry__ 


U- 1 


^ 2 


(r- k)a 2 +2a(d 2 +kd 2 fi ) 

y, (1 / a )y.. 


d 2 >0 


d 2 =0 


(4- 48a) 
(4-48b) 


A continuacidn se calculan las estimaciones combinadas para los datos del ejemplo 4-5. Por la tabla 
4-25 se obtiene d 2 = MS E = 0.65 y M5 Bloques(ajustados) = 22.03. (Observe que para calcular MS Bloque5(ajustados) se 
hace uso del hecho de que dste es un diseno simetrico. En general, debe usarse la ecuacion 4-46.) Puesto 
que M5 B | 0ques(ajustados) > MS E , se usa la ecuacion 4-47 para estimar como 

2 (22.03- 0.65)(3) 

°> 3(3=1) - 802 

Por lo tanto, pueden sustituirse a 2 = 0.65 y d^ = 8.02 en la ecuacion 4-48a para obtener las estimaciones 
combinadas que se enlistan enseguida. Por conveniencia, tambien se presentan las estimaciones intrablo- 
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ques e interbloques. En este ejemplo, las estimaciones combinadas estan proximas a las estimaciones in- 
trabloques debido a que la varianza de las estimaciones interbloques es relativamente grande. 

Pardmetro Estimation intrabloques Estimacidn interbloques Estimaci6n combinada 


- 1.12 

10.50 

- 1.09 

- 0.88 

- 3.50 

- 0.88 

- 0.50 

- 0.50 

- 0.50 

2.50 

- 6.50 

2.47 


4 5 PROBLEMAS 

4-1. Un quimico quiere probar el efecto de cuatro agentes quimicos sobre la resistencia de un tipo particular de 
tela. Debido a que podria haber variabilidad de un rollo de tela a otro, el quimico decide usar un diseno de blo- 
ques aleatorizados, con los rollos de tela considerados como bloques. Selecciona cinco rollos y aplica los 
cuatro agentes quimicos de manera aleatoria a cada rollo, A continuacidn se presentan las resistencias a la 
tensidn resultantes. Analizar los datos de este experimento (utilizar a - 0,05) y sacar las conclusiones 
apropiadas. 


Agente 

quimico 



Rollo 



1 

2 

3 

4 

5 

1 

73 

68 

74 

71 

67 

2 

73 

67 

75 

72 

70 

3 

75 

68 

78 

73 

68 

4 

73 

71 

75 

75 

69 


4-2. Se est&n comparando tres soluciones de lavado diferentes a fin de estudiar su efectividad para retardar el 
crecimiento de bacterias en contenedores de leche de 5 galones, El an&lisis se hace en un laboratorio y sdlo 
pueden realizarse tres ensayos en un dia. Puesto que los dias podrian representar una fuente potencial de va- 
riabilidad, el experimentador decide usar un diseno de bloques aleatorizados. Se hacen observaciones en 
cuatro dias, cuyos datos se muestran enseguida. Analizar los datos de este experimento (utilizar a = 0.05) y 
sacar las conclusiones apropiadas. 


Solucidn 


Dias 


1 

2 

3 

4 

1 

13 

22 

18 

39 

2 

16 

24 

17 

44 

3 

5 

4 

1 

22 


4-3. Graficar las resistencias a la tensidn medias observadas para cada tipo de agente quimico en el problema 4-1 
y compararlas con una distribucidn t con la escalacidn apropiada. 6Qu6 conclusiones se sacarian a partir de 
esta representacidn gr&fica? 

4-4. Graficar los conteos de bacterias promedio para cada solucidn en el problema 4-2 y compararlos con una dis- 
tribucidn t escalada. LQu6 conclusiones pueden sacarse? 

4-5. En un articulo de Fire Safety Journal (“El efecto del diseno de boquillas en la estabilidad y el desempeno de 
surtidores de agua turbulenta”, vol. 4) se describe un experimento en el que se determind un factor de la for- 
ma para varios disenos diferentes de boquillas con seis niveles de la velocidad del flujo de salida del surtidor. 
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El interns se centr6 en las diferencias potenciales entre los disenos de las boquillas, con la velocidad conside- 
rada como una variable perturbadora. Los datos se presentan a continuacidn. 


Diseno de la 
boquilla 

Velocidad del flujo de salida del surtidor (m/s) 

11,73 

14.37 

16.59 

20.43 

23.46 

28.74 

1 

0.78 

0.80 

0.81 

0.75 

0.77 

0,78 

2 

0.85 

0.85 

0.92 

0.86 

0.81 

0.83 

3 

0.93 

0.92 

0.95 

0,89 

0.89 

0.83 

4 

1.14 

0.97 

0.98 

0,88 

0.86 

0.83 

5 

0.97 

0.86 

0.78 

0.76 

0.76 

0.75 


a) LEI diseno de la boquilla afecta el factor de la forma? Comparar las boquillas con un diagrama de disper- 
sidn y con un an£lisis de varianza, utilizando a = 0.05. 

b) Analizar los residuales de este experimento. 

c) LQu€ disenos de las boquillas son diferentes con respecto al factor de la forma? Trazar una grdfica del 
factor de la forma promedio para cada tipo de boquilla y compararla con una distribucidn t escalada. 
Comparar las conclusiones que se sacaron a partir de esta gr&fica con las de la prueba del rango multiple 
de Duncan. 

4-6. Considere el experimento del algoritmo para controlar la proporcidn de alumina del capitulo 3, seccidn 3-8. 
El experimento se llevd a cabo en realidad como un diseno de bloques aleatorizados, en el que se selecciona- 
ron seis periodos como bloques, y se probaron los cuatro algoritmos para controlar la proporcidn en cada pe- 
riodo, El voltaje promedio de la celda y la desviacidn estdndar del voltaje (indicada entre par6ntesis) para 
cada celda son los siguientes: 


Algoritmo 
para controlar 
la proportion 



Tiempo 



1 

2 

3 

4 

5 

6 

1 

4.93 (0.05) 

4.86 (0.04) 

4.75 (0.05) 

4.95 (0.06) 

4.79 (0.03) 

4.88 (0.05) 

2 

4.85 (0.04) 

4.91 (0.02) 

4.79 (0.03) 

4.85 (0.05) 

4.75 (0.03) 

4.85 (0.02) 

3 

4.83 (0,09) 

4.88 (0.13) 

4.90 (0.11) 

4.75 (0.15) 

4.82 (0.08) 

4.90 (0.12) 

4 

4.89 (0.03) 

4.77 (0.04) 

4,94 (0.05) 

4.86 (0.05) 

4.79 (0.03) 

4.76 (0.02) 


a ) Analizar los datos del voltaje promedio de las celdas. (Utilizar a = 0.05.) 6La eleccidn del algoritmo para 
controlar la proporcidn afecta el voltaje promedio de las celdas? 

b ) Realizar el andlisis apropiado de la desviacidn est&ndar del voltaje. (Recuerde que a 6ste se le llamd “rui- 
do del crisol”.) 6La eleccidn del algoritmo para controlar la proporcidn afecta el ruido del crisol? 

c) Realizar los an£lisis residuales que parezcan apropiados. 

d) 6Que algoritmo para controlar la proporcidn deberfa seleccionarse si el objetivo es reducir tanto el vol- 
taje promedio de las celdas como el ruido del crisol? 

4-7. El fabricante de una aleacidn maestra de aluminio produce refinadores de textura en forma de lingotes. La 
companfa produce el producto en cuatro homos, Se sabe que cada homo tiene sus propias caracteristicas 
unicas de operacidn, por lo que en cualquier experimento que se corra en la fundicidn en el que se use mds de 
un horno, los hornos se considerardn como unavailable perturbadora, Los ingenieros del proceso sospechan 
que la velocidad de agitacidn afecta la medida de la textura del producto. Cada horno puede operarse con 
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cuatro djferentes velocidades de agitacibn. Se lleva a cabo un diseno de bloques aleatorizados para un refina- 
dor particular y los datos resultantes de la medida de la textura se muestran a continuation: 


Velocidad de agitacibn (rpm) 

1 

Homo 

2 3 

4 

5 

8 

4 

5 

6 

10 

14 

5 

6 

9 

15 

14 

6 

9 

2 

20 

17 

9 

3 

6 


a) £Existe evidencia de que la velocidad de agitation afecta la medida de la textura? 

b) Representar los residuales de este experimento en una grafica de probabilidad normal Interpretar esta grafica. 

c) Graficar los residuales contra el horno y la velocidad de agitacibn. £Esta grafica proporciona alguna in- 
formation util? 

d) 6Cual sen a la recomendacion de los ingenieros del proceso con respecto a la election de la velocidad de 
agitacion y del horno para este refinador de textura particular si es deseable una medida de la textura pe- 
quena? 

4-8. Analjzar los datos del problerna 4-2 utilizando la prueba general de signification de la regresion. 

4-9. Suponiendo que los tipos de agentes qufmicos y los rollos de tela son fijos, estimar los parametros del modelo 
T; y fa del problerna 4-1. 

4-10. Trazar una curva de operation caracteristica para el diseno del problerna 4-2. £La prueba parece ser sensible 
a las diferencias pequenas en los efectos de los tratamientos? 

4-11. Suponga que falta la observation del agente quimico 2 y el rollo 3 en el problerna 4-1. Analizar el problerna 
estimando el valor faltante. Realizar el anfdisis exacto y comparar los resultados. 

4-12. Dos valores faltantes en un bloque aleatorizado . Suponga que en el problerna 4-1 faltan las observaciones del 
agente quimico tipo 2 y el rollo 3 y del agente qumheo tipo 4 y el rollo 4. 

a) Analizar el diseno haciendo la estimation iterativa de los valores faltantes, como se describe en la sec- 
cion 4-1.3. 

b) Derivar SS E con respecto a los dos valores faltantes, igualar los resultados con cero y resolver las ecuacio- 
nes para las estimaciones de los valores faltantes. Analizar el diseno utilizando estas dos estimations de 
los valores faltantes, 

c) Deducir las fbrmulas generales para estimar dos valores faltantes cuando las observaciones estdn en blo- 
ques diferentes . 

d) Deducir las formulas generales para estimar dos valores faltantes cuando las observaciones estan en el 
mismo bloque. 

4-13. Un ingeniero industrial estd realizando un experimento sobre el tiempo de enfoque del ojo. Se interesa en el 
efecto de la distancia del objeto al ojo sobre el tiempo de enfoque. Cuatro distancias diferentes son de inte- 
res. Cuenta con cinco sujetos para el experimento. Debido a que puede haber diferencias entre los indivi- 
duos, el ingeniero decide realizar el experimento en un diseno de bloques aleatorizados. Los datos obtenidos 
se presentan a continuacibn. Analizar los datos de este experimento (utilizar a ~ 0.05) y sacar las concjusio- 
nes apropiadas. 


Distancia (pies) 

4 

6 

8 

10 


Sujeto 

1 2 3 4 5 

10 6 6 6 6 

7 6 6 1 6 

5 3 3 2 5 

6 4 4 2 3 
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4-14. Se estudia el efecto de cinco ingredientes diferentcs (A, B, C, D y E) sobre el tiempo de reaction de un proce- 
so qufmico. Cada lote de material nuevo solo alcanza para permitir la realization de cinco corridas. Ademas, 
cada corrida requiere aproximadamente 1 V 2 horns, por lo que sdlo pueden realizarse cinco corridas cn un 
dia. El experimentador decide realizar el experinrento como un cuadrado latino para que los efectos del dia y 
el lote puedan controlarse sistematicamente. Obtiene los datos que se muestran enseguida. Analizar los da- 
tos de este experimento (utilizar a = 0.05) y saear conclusiones. 


Lote 



Dia 



1 

2 

3 

4 

5 

1 

A =8 

B = 1 

D = 1 

C = 7 

E -3 

2 

C = 11 

E = 2 

A = 1 

D = 3 

B = 8 

3 

B = 4 

A =9 

C = 10 

E= 1 

D = 5 

4 

D = 6 

C = 8 

E = 6 

B = 6 

A = 10 

5 

E = 4 

D = 2 

B = 3 

A = 8 

C = 8 


4-15. Un ingeniero industrial investiga el efecto de cuatro metodos de ensamblaje (A, B, CyD) sobre el tiempo de 
ensamblaje de un componente de televisores a color. Se seleccionan cuatro operadores para el estudio. Ade- 
m&s, el ingeniero sabe que todos los metodos de ensamblaje producen fatiga, de tal modo que el tiempo re- 
querido para el ultimo ensamblaje puede ser mayor que para el primero, independientemente del metodo. 
Es decir, se desarrolla una tendencia en el tiempo de ensamblaje requerido, Para tomar en cuenta esta fuente 
de variabilidad, el ingeniero emplea el diseno del cuadrado latino que se presenta a continuation, Analizar 
los datos de este experimento (a = 0.05) y sacar las conclusiones apropiadas. 


Orden de 
ensamblaje 


Operador 


1 

2 

3 

4 

1 

C= 10 

D = 14 

A = 7 

B = 8 

2 

B = 1 

C - 18 

D = 11 

^4-8 

3 

A = 5 

B = 10 

C = 11 

D — 9 

4 

D = 10 

A = 10 

B = 12 

C = 14 


4-16. Suponga que en el problema 4-14 falta la observacidn del lote 3 en el dia 4. Estimar el valor faltante con la 
ecuacidn 4-24, y realizar el andlisis utilizando este valor. 

4-17. Considere un cuadrado latino p x p con renglones (aj, columnas (J3 k ) y tratamientos (tj) fijos. Obtener esti- 
maciones de mmimos cuadrados de los par&metros del modelo a i3 y r ; . 

4-18. Deducir la fdrmula del valor faltante (ecuacidn 4-24) para el diseno del cuadrado latino. 

4-19, Disehos que incluyen varios cuadrados latinos . (Ver Cochran y Cox [26] y John [6 Id],) El cuadrado latino p x p 
contiene unicamentep observaciones para cada tratamiento. Para obtener m&s r6plicas, el experimentador 
puede usar varios cuadrados, por ejemplo n. No es relevante si los cuadrados usados son el mismo o son dife- 
rentes. El modelo apropiado es 

i = 1 , 2 ,..., p 
j = l, 2,..., p 
k= 1 , 2 ,..., p 
h= 1 , 2 ,..., n 


y,M = H+P* +«.(*> + T i +( t P)jh +e m 
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dond ey m es la observation del tratamiento j en el rengldn i y la columna k del cuadrado h-6 simo. Observe 
que a m y fi k{h) son los efectos del rengldn y la columna en el cuadrado ft-6simo, p h es el efecto del cuadrado 
h-6 simo y (r p) Jh es la interaccidn entre los tratamientos y los cuadrados. 

a) Establecer las ecuaciones normales para este modelo y resolvbrlas para las estimaciones de los par&me- 
tros del modelo* Suponga que las condiciones auxiliares apropiadas de los pardmetros son % h p b = 0, 
2 ,«,<*) = 0 y 'EJ k{h) = 0 para cada h, = 0, 2 y (r/)) y , = 0 para cada h y 2 k (ip) ih = 0 para cada j. 

b) Desarrollar la tabla del an£lisis de varianza para este diseno. 

4-20. Comentar la forma en que pueden utilizarse las curvas de operacidn caracteristica del apdndice con el diseno 
del cuadrado latino. 

4-21. Suponga que en el problema 4-14 los datos tornados en el dia 5 se analizaron incorrectamente y fue necesario 
descartarlos. Desarrollar un anfilisis apropiado para los datos restantes. 

4-22* El rendimiento de un proceso quimico se midid utilizando cinco lotes de materia prima, cinco concentracio- 
nes del atido, cinco tiempos de procesamiento {A, B, C, D y E) y cinco concentraciones del catalizador (a, ft, 
y, <5, c). Se usd el cuadrado grecolatino siguiente. Analizar los datos de este experimento (utilizar a - 0.05) y 
sacar conclusiones. 


Lote 



Concentracidn del dcido 



1 

2 

3 

4 

5 

1 

Aa = 26 

BP = 16 

Cy = 19 

Dd = 16 

Ee = 13 

2 

By = 18 

C6 = 21 

De - 18 

Ea = 11 

A& = 21 

3 

Ce =20 

Da = 12 

Ep = 16 

Ay = 25 

Bd = 13 

4 

Dp — 15 

Ey = 15 

Ad = 22 

Be = 14 

Ca = 17 

5 

Ed = 10 

Ae = 24 

Ba = 17 

Cp = 17 

Dy = 14 


4-23. Suponga que en el problema 4-15 el ingeniero sospecha que los sitios de trabajo usados por los cuatro opera- 
dores pueden representar una fuente adicional de variacidn. Es posible introducir un cuarto factor, el sitio de 
trabajo (a, y, <5), y realizar otro experimento, de donde resulta el cuadrado grecolatino siguiente. Analizar 
los datos de este experimento (utilizar a = 0.05) y sacar conclusiones. 


Orden de 
ensamblaje 


Operador 


1 

2 

3 

4 

1 

cp = 11 

By = 10 

Dd = 14 

A a = 8 

2 

Ba = 8 

Cd = 12 

Ay — 10 

DP = 12 

3 

Ad = 9 

Da = 11 

Bp = 1 

Cy — 15 

4 

Dy = 9 

Ap = 8 

Ca = 18 

Bd = 6 


4-24. Construir un hipercuadrado 5x5 para estudiar los efectos de cinco factores. Desarrollar la tabla del andlisis 
de varianza para este diseno. 

4-25. Considere los datos de los problemas 4-15 y 4-23. Despuds de eliminar las letras griegas del problema 4-23, 
analizar los datos utilizando el mdtodo desarrollado en el problema 4-19. 

4-26. Considere el diseno de bloques aleatorizados con un valor faltante en la tabla 4-7. Analizar los datos utilizan- 
do el analisis exacto del problema del valor faltante revisado en la seccidn 4-1.4. Comparar los resultados con 
el anAlisis aproximado de estos datos que se presenta en la tabla 4-8, 

4-27. Un ingeniero estudia las caracteristicas del rendimiento de combustible de cinco tipos de aditivos de gasoli- 
na. En la prueba de carretera el ingeniero desea usar los automdviles como bloques; sin embargo, debido a 
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una restriction de tiempo, debe utilizar un disefio de bloques incompletos. Realiza el diseno balanceado con 
los cinco bloques siguientes, Analizar los datos de este experimento (utilizar a = 0,05) y sacar conclusions. 


Aditivo 


Automdvil 


1 

2 

3 

4 

5 

1 


17 

14 

13 

12 

2 

14 

14 


13 

10 

3 

12 


13 

12 

9 

4 

13 

11 

11 

12 


5 

11 

12 

10 


8 


4-28, Construir un conjunto de contrastes ortogonales para los datos del problema 4-27, Calcular la suma de cua- 
drados para cada contraste. 

4-29. Se estudian siete concentraciones diferentes de madera dura para determinar su efecto sobre la resistencia 
del papel producido. Sin embargo, en la planta piloto s61o pueden hacerse tres corridas de production por 
dia. Dado que los dias pueden diferir, el analista utiliza el diseno de bloques incompletos balanceados que se 
muestra abajo. Analizar los datos de este experimento (utilizar a — 0.05) y sacar conclusiones. 


Concentracidn de 
madera dura (%) 




Dias 




1 

2 

3 

4 

5 

6 

7 

2 

114 




120 


117 

4 

126 

120 




119 


6 


137 

117 




134 

8 

141 


129 

149 




10 


145 


150 

143 



12 



120 


118 

123 


14 




136 


130 

127 


4-30. Analizar los datos del ejemplo 4-6 utilizando la prueba general de signification de la regresidn, 

4-31. Demostrar que j (la) es la suma de cuadrados ajustada de los tratamientos en un BIBD. 

4-32. Un experimentador quiere comparar cuatro tratamientos en bloques de dos corridas. Encontrar un BIBD 
para este experimento con seis bloques. 

4-33. Un experimentador quiere comparar ocho tratamientos en bloques de cuatro corridas. Encontrar un BIBD 
con 14 bloques y 2 = 3. 

4-34. Realizar el an£lisis interbloques del diseno del problema 4-27. 

4-35. Realizar el andlisis interbloques del diseno del problema 4-29, 

4-36. Comprobar que no existe un BIBD con par£metros a - 8, r = 8, k = 4 y b = 16, 

4-37. Demostrar que la varianza de los estimadores intrabloques {r,} es k(a-l)o 2 / (la 2 ). 

4-38. Disefws extendidos de bloques incompletos. Ocasionalmente, el tamano del bloque cumple con la relation a < k 
< 2a. Un diseno extendido de bloques incompletos consiste en una sola r6plica de cada tratamiento en cada 
bloque junto con un diseno de bloques incompletos con k* = k - a. En el caso balanceado, el diseno de blo- 
ques incompletos tendr& los par&metros k* =k-a>r* ~r-6yA*. Desarrollar el an&lisis estadfstico, (Suge* 
rencia: en el diseno extendido de bloques incompletos, se tiene 2 = 2r - b + A*.) 




Introduction 
a los disenos 
factoriales 


5- 1 DEFINICIONES Y PRINCIPIOS BASICOS 

En rauchos experimentos interviene el estudio de los efectos de dos o mas factores. En general, los dise- 
nos factoriales son los mas eficientes para este tipo de experimentos. Por diseno factorial se entiende que 
en cada ensayo o replica completa del experimento se investigan todas las combinaciones posibles de los 
niveles de los factores. Por ejemplo, si el factor^ tiene a niveles y el factor B tiene b niveles, cada replica 
contiene todas las ab combinaciones de los tratamientos. Cuando los factores estan incluidos en un dise- 
no factorial, es comun decir que estan cruzados. 

El efecto de un factor se define como el cambio en la respuesta producido por un cambio en el nivel 
del factor. Con frecuencia se le llama efecto principal porque se refiere a los factores de interns primario 
en el experimento. Por ejemplo, considere el experimento sencillo de la figura 5-1. Se trata de un experi- 
mento factorial de dos factores en el que los dos factores del diseno tienen dos niveles. A estos niveles se 
les ha denominado “bajo” y “alto” y se denotan como y respectivamente. El efecto principal del 
factors de este diseno de dos niveles puede visualizarse como la diferencia entre la respuesta promedio 
con el nivel bajo de^4 y la respuesta promedio con el nivel alto de A. Num6ricamente, esto es 

, 40+52 20+30 „„ 

2 2 

Es decir, cuando el factor.4 se incrementa del nivel bajo al nivel alto se produce un incremento de la res- 
puesta promedio de 21 unidades. De manera similar, el efecto principal de B es 

„ 30+52 20+40 „ 

2 2 

Cuando los factores tienen mds de dos niveles, es necesario modificar el procedimiento anterior, ya que 
existen otras formas de definir el efecto de un factor. Este punto se estudia con mayor profundidad mas 
adelante. 

En algunos experimentos puede encontrarse que la diferencia en la respuesta entre los niveles de un 
factor no es la misma para todos los niveles de los otros factores. Cuando esto ocurre, existe una interac- 
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o 

u 

« 




(Bajo) (Alto) 

Factor A 


(Bajo) (Alto) 

Factor A 


Figura 5-1 Experimento factorial de dos Figura 5-2 Experimento factorial de dos 

factores con la respuesta (y) indicada en los factores con interaccidn. 

vertices. 


ci6n entre los factores. Por ejemplo, considere el experimento factorial de dos factores que se ilustra en la 
figura 5-2, Con el nivel bajo del factor B (o B ~ ), el efecto de A es 


A — 50-20= 30 


y con el nivel alto del factor B (o B + ), el efecto de A es 

A~ 12—40 = —28 


Puesto que el efecto de^4 depende del nivel que se elige para el factor B, se observa que existe una interac- 
cidn entre A y B. La magnitud del efecto de la interaccidn es la diferencia promedio de estos dos efectos de 
A , o AB = (“28 - 30)/2 = -29, Evidentemente, en este experimento la interaccion es grande. 

Estas ideas pueden ilustrarse gr&ficamente. En la figura 5-3 se grafican los datos de las respuestas de 
la figura 5-1 contra el factor^ para ambos niveles del factor B, Observe que las rectasi?"yi? + son aproxi- 
madamente paralelas, lo cual indica la ausencia de interaccion entre los factores A y J5, De manera simi- 
lar, en la figura 5-4 se grafican los datos de las respuestas de la figura 5-2. En este caso se observa que las 
rectasiTy no son paralelas, Esto indica una interaccidn entre los factores^l y i?. Graficas como estas 
son de gran ayuda para interpretar las interacciones significativas y para reportar los resultados al perso- 
nal sin preparacion estadistica. Sin embargo, no deberan utilizarse como la unica t^cnica para el an&lisis 
de datos, ya que su interpretation es subjetiva y su apariencia con frecuencia es enganosa. 




Figura 5-3 Experimento factorial sin in 
teracci6n. 


Figura 5-4 Experimento factorial con inter- 
accion. 
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El concepto de interaccidn puede ilustrarse de otra manera, Suponga que los dos factores del diseno 
tratado son cuantitativos (temperatura, presidn, tiempo, etc.). Entonces una representation con un mo- 
delo de regresidn del experimento factorial de dos factores podria escribirse como 

y — /? 0 ^ 12 ^ 1^2 

dondey es la respuesta, las/? son pardmetros cuyos valores deben determinate, x x es una variable que re- 
presenta al factor A,x 2 es una variable que representa al factor B, y e es un termino del error aleatorio, Las 
variables x x yx 2 se definen en una escala codificada de -1 a +1 (los niveles bajo y alto de^4 y B), yxp 2 re- 
presenta la interaction entre x 1 y x 2 . 

Las estimaciones de los parametros en este modelo de regresidn resultan estar relacionadas con las 
estimaciones de los efectos. Para el experimento ilustrado en la figura 5-1 se encuentra que los efectos 
principales dtA y B son^4 = 21yJ5 = ll, Las estimaciones de /?! y/? 2 son la mitad del valor del efecto prin- 
cipal correspondiente; por lo tanto, = 21 / 2 = 10,5 y /J 2 = 11 / 2 = 5.5. El efecto de la interaccidn de la 
figura 5-1 es AB ~ 1, por lo que el valor del coeficiente de la interaction en el modelo de regresidn es 
^ 12 - 1/2= 0.5. El par£metro /? 0 se estima con el promedio de las cuatro respuestas, o 
- (20+40+30+52)/ 4= 35.5. Por lo tanto, el modelo de regresidn ajustado es 

5>“ 35.5+ 10.5^ + 5.5x 2 + 0.5 x 1 jc 2 



a) La superficie de respuesta 



fe) La gr3fica de contorno 


Figura 5-5 La superficie de respuesta y la gr£fica de contorno para el mode- 
lo y ~ 35.5 + 10.5^! + 5,5x 2 - 
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Las estimaciones de los parametros obtenidas de esta manera para el disefio factorial en el que todos los 
factores tienen dos niveles (-y +) resultan ser estimaciones de minimos cuadrados (se abundar& sobre el 
tema mas adelante). 

El coeficiente de la interaccibn (/? 12 * 0.5) es pequeno en coraparacibn con los coeficientes de los 
efectos principals y/? 2 .La interpretacibn que se hara de este hecho es que la interaccibn es pequena y 
puede ignorarse. Por lo tanto, al eliminar el termino 0.5x^ 2 se obtiene el modelo 

y= 3515+10.5*! + 5.5* 2 

En la figura 5-5 se muestran las representaciones grdficas de este modelo. En la figura 5-5 a se tiene una 
gr&fica del piano de los valores dey generados por las diferentes combinaciones de*! yx 2 . A esta gr£fica 
tridimensional se le llama grdfica de superficie de respuesta. En la figura 5-56 se muestran las lineas de 
contorno para las respuestas constantesy en el piano x 1 ,x 2 . Observe que como la superficie de respuesta es 
un piano, la griifica de contorno contiene lineas rectas paralelas. 

Suponga ahora que la contribucibn de la interaccibn en el experimento no fuera insignificante; es de- 
cir, que el coeficiente f} 12 no fuera pequeno. En la figura 5-6 se presenta la superficie de respuesta y la gr&- 
fica de contorno del modelo 

y= 35.5+10.5*1 +5.5* 2 +&r 1 * 2 



a) La superficie de respuesta 



b ) La gr^fica do contorno 

Figura 5-6 La superficie de respuesta y la gr&fica de contorno para el mo- 
delo y = 35*5 + 10.5*! + 5.5* 2 + 
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(Se ha hecho que el efecto de la interaction sea el promedio de los dos efectos principales.) Observe que 
el efecto significative* de la interaccidn provoca el “torcimiento 5 ’ del piano de la figura 5 -6a. Este torci- 
miento de la superficie de respuesta produce lineas de contorno curvas para las respuestas constantes en 
el piano x 1 ,x 2 , como se muestra en la figura 5-6b. Por lo tanto, una interaction es una forma de curvatura 
en el modelo de superficie de respuesta fundamental del experimento. 

El modelo de superficie de respuesta de un experimento es de gran importancia y utilidad. El tema se 
ampliard en la section 5-5 y en capitulos posteriores. 

En general, cuando una interaccidn es grande, los efectos principales correspondientes tienen escaso 
significado pr&ctico. En el experimento de la figura 5-2, la estimation del efecto principal d gA sena 

, 50 + 12 20+40 

Am ~ 2 “ = 1 

que es muy pequeno, y se llegaria a concluir que no hay ningun efecto debido a A. Sin embargo, cuando se 
examinan los efectos de/1 con niveles diferentes del factor B, se observa que no es este el caso. El factor y 4 
tiene un efecto, pero depende del nivel del factor B. Es decir, el conocimiento de la interaction yl.B es mas 
util que el conocimiento del efecto principal. Una interaction significativa suele enmascarar la significa- 
tion de los efectos principales. Estos puntos se ponen de manifiesto con claridad en la grafica de la inter- 
action de la figura 5-4. En presencia de una interaction significativa, el experimentador debera por lo 
general examinar los niveles de uno de los factores, por ejemplo del factor^, manteniendo fijos los nive- 
les de los otros factores para sacar conclusiones acerca del efecto principal de A. 


5-2 LA VENTAJA DE LOS DISENOS FACTORIALES 

Es sentillo ilustrar la ventaja de los disenos factoriales. Suponga que se tienen dos factores. 4 y B, cada 
uno con dos niveles. Los niveles de los factores se denotan por.4~,.4 + , B~yB + . Podria obtenerse informa- 
tion acerca de ambos factores haci6ndolos variar uno a la vez, como se muestra en la figura 5-7. El efecto 
de cambiar el factor A estd dado poiA + B--A~B~, y el efecto de cambiar el factor!? estd dado por^4‘B + - 
A~B~. Debido a que esta presente el error experimental, es deseable realizar dos observaciones, por ejem- 
plo, para cada combinacidn de tratamientos y estimar los efectos de los factores utilizando las respuestas 
promedio. Por lo tanto, se necesita un total de seis observaciones. 

Si se hubiera efectuado un experimento factorial, se habria registrado una combination adicional 
de los tratamientos, A + B + . Ahora, utilizando solo cuatro observaciones, pueden hacerse dos estimacio- 
nes del efecto AtA\A*Br-A'B~yA + B + -A B 1 . De manera similar, pueden hacerse dos estimaciones del 


O 


Afl f 



L 

+ 

Factor A 


Figura 5-7 Experimento con un factor a la vez. 
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Figura 5-8 Eficiencia relativa de un diseno factorial con 
respecto a un experimento de un factor a la vez (dos niveles 
del factor). 


efecto de B. Estas dos estimaciones de cada efecto principal podrian promediarse para producir efectos 
principales promedio que tienen la misma precision que las estimaciones del experimento con un solo 
factor, pero solo se requieren cuatro observaciones en total, y nosotros diriamos que la eficiencia relati- 
va del diseno factorial con respecto al experimento de un factor a la vez es de (6/4) = 1.5. En general, 
esta eficiencia relativa aumentarA conforme se incremente el numero de factores, como se muestra en 
la figura 5-8. 

Suponga ahora que est£ presente una interaccidn. Si el diseno de un factor a la vez indicara queA/C 
y.VB dieron mejores respuestas que/1 B , una conclusion logica seria que /I ' B* seria todavia mejor. Sin 
embargo, si esta presente una interaccion. esta conclusion puede ser una equivocacidn grave. Para un 
ejemplo, referirse al experimento de la figura 5-2. 

En resumen, observe que los diseiios factoriales ofrecen varias ventajas. Son mas eficientes que los 
experimentos de un factor a la vez. Ademas, un diseno factorial es necesario cuando puede haber interac- 
ciones presentes a fin de evitar llegar a conclusiones incorrectas. Por ultimo, los diseiios factoriales permi- 
ten la estimacidn de los efectos de un factor con varios niveles de los factores restantes, produciendo 
conclusiones que son vdlidas para un rango de condiciones experimentales. 


5-3 DISENO FACTORIAL DE DOS FACTORES 
5-3.1 Un ejemplo 

Los tipos mas simples de diseiios factoriales incluyen unicamente dos factores o conjuntos de tratamien- 
tos. Hay a niveles del factor A y b niveles del factor B, los cuales se disponen en un diseno factorial; es de- 
cir, cada replica del experimento contiene todas las ab combinaciones de los tratamientos. En general, 
hay n replicas. 

Como ejemplo de un diseno factorial en el que intervienen dos factores, un ingeniero esta diseiiando 
una bateria que se usarii en un dispositivo que se someterd a variaciones de temperatura extremas. El uni- 
co parametro del diseno que puede seleccionar en este punto es el material de la placa o anodo de la bate- 
ria, y tiene tres elecciones posibles. Cuando el dispositivo este fabricado y se envie al campo, el ingeniero 
no tendra control sobre las temperaturas extremas en las que operara el dispositivo, pero sabe por expe- 
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labia 5-1 Datos de la vida (en horas) para el ejemplo del diseno de la bateria 


Tipo de 
material 



Tfemperatura (°F) 



15 


70 



125 

1 

130 

155 

34 

40 

20 

70 


74 

180 

80 

75 

82 

58 

2 

150 

188 

136 

122 

25 

70 


159 

126 

106 

115 

58 

45 

3 

138 

110 

174 

120 

96 

104 


168 

160 

150 

139 

82 

60 


riencia que la temperatura probablemente afectara la vida efectiva de la bateria. Sin embargo, la tempe- 
ratura puede controlarse en el laboratorio donde se desarrolla el producto para fines de prueba. 

El ingeniero decide probar los tres materiales de la placa con tres niveles de temperatura — 15, 70 y 
125°F— , ya que estos niveles de temperatura son consistentes con el medio ambiente donde se usard final- 
mente el producto. Se prueban cuatro baterias con cada combinacibn del material de la placa y la tempe- 
ratura, y las 36 pruebas se corren de manera aleatoria. En la tabla 5-1 se presentan los datos del 
experimento y de la vida observada de la bateria. 

En este problema, el ingeniero quiere responder las preguntas siguientes: 

1. tQu6 efectos tienen el tipo de material y la temperatura sobre la vida de la bateria? 

2. iExiste alguna eleccibn del material que produzca de manera regular una vida larga de la bateria 
independientemente de la temperatura ? 

La segunda pregunta es de particular importancia. Quiza sea posible encontrar una alternativa del mate- 
rial que no resulte afectada considerablemente por la temperatura. De ser este el caso, el ingeniero puede 
hacer que la bateria sea robusta para la variacibn de la temperatura en el campo. Se trata de un ejemplo 
de la aplicacibn del diseno experimental estadistico en el diseno de productos robustos, un problema de 
ingenieria muy importante. 

El anterior es un ejemplo especifico del caso general de un diseno factorial de dos factores. Para pa- 
sar al caso general, seay 1;A la respuesta observada cuando el factor A tiene el nivel z'-esimo (i = 1, 2, ..., a) y 
el factor B tiene el nivel y-esimo (j = 1,2, ..., b) en la replica /;-esima (k — 1, 2, ...,w).En general, el experi- 
mento factorial de dos factores aparecerd como en la tabla 5-2. El orden en que se hacen las abn observa- 
ciones se selecciona al azar, por lo que este diseno es un diseno completamente aleatorizado. 


Tabla 5-2 Arreglo general de un diseflo factorial de dos factores 

Factor B 


Factor A 


1 2 ... b 


1 

ym>ym, 

—,yii* 

^1219^122? 

->yun 


Yi&uJimj 

• * • > y 1 bn 

2 

yiibym, 

-Oton 

y 221^2229 
'”>ynn 


y?bi>y2b2j 

•••^y2bn 






a 

^oll?7ol2? 

•••jYaln 

ya2l>y a 22> 

mmm iy<i2n 


* * * J Yafrn 
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Las observaciones de un experimento factorial pueden describirse con un modelo. Hay varias formas 
de escribir el modelo de un experimento factorial. El modelo de los efectos es 


y»k = f i+T i +Pj +( r P)ij +e ijk 


i = 1 , 2 ,..., a 
j = 1, 2 

[k = l, n 


( 5 - 1 ) 


donde (i es el efecto promedio global, r, es el efecto del nivel z'-esimo del factor A de los renglones, /3 ; es el 
efecto del nivel 7-dsimo del factor B de las columnas, (r/ 3 ), y es el efecto de la interaction entre r, y$, y £ ijk es 
un componente del error aleatorio. Se supone que ambos factores son fijos, y los efectos de los tratamien- 
tos se definen como las desviaciones de la media global, por lo que 2 J'. 1 t ( = Oy ; = 0 . De manera si- 
milar, los efectos de las interacciones son fijos y se definen de tal modo que = 2y = ,(r/J).. = 0. 

Puesto que hay n replicas del experimento, hay abn observaciones en total. 

Otro modelo posible de un experimento factorial es el modelo de las medias 


yak = f*a +£ ak 


i = 1 , 2 ,..., a 
; = 1, 2 ,...,b 
k = 1 , 2 ,..., n 


donde la media de la celda z;-esima es 

Thmbi6n podria usarse un modelo de regresidn como en la seccidn 5 - 1 . Los modelos de regresion resultan 
particularmente utiles cuando uno o mas de los factores del experimento son cuantitativos* En la mayor 
parte de este capitulo se usar£ el modelo de los efectos (ecuacidn 5 - 1 ) con referencia al modelo de regre- 
sion en la seccidn 5 - 5 . 

En el diseno factorial de dos factores, los factore's (o tratamientos) de los renglones y las columnas,/! 
y B, son de igual interns. Especfficamente, el interns se encuentra en probar hipdtesis acerca de la igual- 
dad de los efectos de los tratamientos de los renglones, por ejemplo, 

= *2=^ -=*.«0 (5-2a) 

H x : al menos una r . * 0 


y de la igualdad de los efectos de los tratamientos de las columnas, por ejemplo, 

Pi =•**= Pb—0 
Hjial menos una /? , * 0 


( 5 - 2 b) 


Thmbien existe interns en determinar si los tratamientos de los renglones y las columnas inter actuan. Por 
lo tanto, tambicn querria probarse 

H o : (rf)a = 0 P ara todas las *• j ( 5 . 2 c) 

Hjial menos una (TjS) iy * 0 


A continuation se indica c6mo se prueban estas hipotesis utilizando un analisis de varianza de dos factores. 


5-3.2 Analisis estadistico del modelo con efectos fijos 

Sea que y L denote el total de observaciones bajo el nivel z-esimo del factor A, quey y . denote el total de 
observaciones bajo el nivel 7-6 simo del factor B, que y ih denote el total de observaciones de la celda 
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z/-6sima, y quey denote el gran total de todas las observaciones. Se defineny,,y ; ,y l} yy como los pro- 
medios correspondientes de los renglones, las columnas, las celdas y el gran promedio. Expresado ma- 
tematicamente, 


yu = y<ik 

7=1 *=1 

y. 

y, ~ bn 

z = 1, 2,..., a 

a n 

y.j, *— 2! y fa 

/= 1 k=l 

y,=^ 

an 


n 

y^. =^y,jk 

Jfc=l 

v;i 

II 

»l* 

i = 1, 2,..., a 

7 = 1, 2,..., 6 

N- 

1! 

iM s 

'i 

Vi 

'S' 




La suma de cuadrados total corregida puede escribirse como 

222 Ov - y ... ) 2 = EXE - y~ ) + (xy. - ?... ) 

t=l 7=1 k=l /= 1 j-1 k = 1 

Hb - y L - y.j. + y... )+(y# - h )f 

= bn J (y L ~ y_ ) 2 (y. y . - X.. ) 2 (5-4) 

/=1 ;=i 

a b 

(yij.-yi..-y.j.+y..,) 2 

i-i j~i 

+SSS (yijk-%.) 2 

1=1 ;=1 fc=l 

ya que los seis productos cruzados del lado derecho de la igualdad son cero. Observe que se ha hecho la 
particidn de la suma de cuadrados total en una suma de cuadrados debida a “los renglones”, o factor^ 
(SS A ); una suma de cuadrados debida a “las columnas”, o factor B ( SS B ); una suma de cuadrados debida a 
la interaccidn entreA y B (SS AB ); y una suma de cuadrados debida al error ( SS E ). Por el ultimo componen- 
te del lado derecho de la igualdad de la ecuacidn 5-4, se observa que debe haber por lo menos dos rdplicas 
(n > 2) para obtener una suma de cuadrados del error. 

La ecuacidn 5-4 puede escribirse simbdlicamente como 

SS T = SS A + SS B + + SS E (5-5) 

El numero de grados de libertad asociado con cada suma de cuadrados es 


Efecto 

~A~ 

B 

Interaccidn A£? 
Error 


Grados de libertad 


a- 1 
b - 1 

(a - l)(b - 1) 
ab(n -1) 
abn -1 


Tbtal 
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Esta asignacidn de los abn - 1 grados de libertad totales a las sumas de cuadrados puede justificarse de la 
siguiente manera: los efectos principales-4 y B tienen ay b niveles, respectivamente; por lo tanto, tienen a 
- 1 y b - 1 grados de libertad, como se indica. Los grados de libertad de la interaccidn son sdlo el numero 
de grados de libertad de las celdas (que es ab - 1) menos el numero de grados de libertad de los dos efec- 
tos principales-d y B; es decir, ab-\-(a-l)-(b-l) = (a- 1)(6 - 1). Dentro de cada una de las ab celdas 
hay n - 1 grados de libertad entre las n replicas; por lo tanto hay ab(n - 1) grados de libertad para el error. 
Observe que la suma del numero de grados de libertad en el lado derecho de la ecuacion 5-5 es igual al nu- 
mero total de grados de libertad. 

Cada suma de cuadrados dividida por sus grados de libertad es un cuadrado medio. Los valores espe- 
rados de los cuadrados medios son 


E{MS a ) 


-a- 


bn^ rf 

i = 1 

a — 1 

b 






2 ; =1 


(a-IXft-l) 


y 



Observe que si es verdadera la hipdtesis nula de que no hay efectos de los tratamientos de los renglones, 
ni de los tratamientos de las columnas, ni interaccidn, entonces MS A , MS B , MS M y MS E son todas estima- 
ciones de o 2 . Sin embargo, si hay diferencias entre los efectos de los tratamientos de los renglones, por 
ejemplo, entonces MS A serfi mayor que MS E . De manera similar, si estan presentes efectos de los trata- 
mientos de las columnas o de la interaccidn, entonces los cuadrados medios correspondientes seran ma- 
yores que MS E . Por lo tanto, para probar la significacidn de los dos efectos principales y su interaccidn, 
simplemente se divide el cuadrado medio correspondiente por el cuadrado medio del error. Los valores 
grandes de este cociente implican que los datos no apoyan la hipdtesis nula. 

Si se supone que el modelo (ecuacidn 5-1) es adecuado y que los tdrminos del error e ijk tienen una dis- 
tribucidn normal e independiente con varianza a 2 constante, entonces cada uno de los cocientes de cua- 
drados medios MS A /MS E , MS B /MS E y MS AB /MS E se distribuyen como F con a — 1, b -ly (a - l)(b - 1) 
grados de libertad en el numerador, respectivamente, y ab(n - 1) grados de libertad en el denominador, 1 y 
la regidn critica seria la cola superior de la distribucidn F. El procedimiento de prueba suele resumirse en 
una tabla del andlisls de varianza, como se muestra en la tabla 5-3. 

En lo que a los cdlculos se refiere, por lo general se emplea un paquete de software de estadistica para 
realizar el an&lisis de varianza. Sin embargo, no es complicado obtener f6rmulas para calcular manual- 


La prueba F puede considerate como una aproximacidn de una prueba de aleatorizacidn, como se senald anteriormente. 
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Tab la 5-3 La tabla del anfllisis de varianza para el diseno factorial de dos factores, modelo con efectos fijos 


Fuente de 

Suma de 

Grados de 





variation 

cuadrados 

libertad 


Cuadrado medio 


F o 

Ttatamientos-4 

SSa 

a - 1 

ms a = 

SS A 

a-l 

^0 

_ms a 

ms e 

Tratamientos B 

ss B 

b - 1 

MS„ = 

SS B 
b - 1 


_ms b 

ms e 

Interaction 


(a-l)(b-l) 

MS ab -- 

SS.4B 

F ° 

_ms ab 



ms e 

Error 

SS E 

ab(n —1) 

% 

II 

SS B 





ab(n —1) 



Total 

ss r 

abn “1 






mente las sumas de cuadrados de la ecuacidn 5-5. La suma de cuadrados total se caleula como de costum- 
bre con 


/=i j = i k=t 

Las sumas de cuadrados de los efectos principales son 

ss ^ht rf 

Es conveniente obtener SS^ en dos pasos. Se calcula primero la suma de cuadrados entre los totales de 
las ab celdas, a la que se denomina la suma de cuadrados debida a los “subtotales”: 


_2 L 

abn 

(5-6) 

,L_ 

abn 

(5-7) 

.yL 

abn 

(5-8) 


SS 


Subtotales 


1 a p 

= iyy 


Esta suma de cuadrados tambidn contiene a SS A y SS B . Por lo tanto, el segundo paso consiste en calcular 
SS M como 

(5-9) 
(5-10) 


~ ^Subtotales A SS B 
Puede calcularse SS E por sustraccion como 

SS E = SS T -SS AB -SS A -SS B 
o 

SS r = SS T — SS e llhtr ,,. 


EJEMPLO 5-1 

El experimento del diseno de la bateria 

En la tabla 5-4 se presenta la vida efectiva (en horas) observada en el ejemplo del diseno de la bateria que 
se describid en la seccidn 5-3.1. Los totales de los renglones y las columnas se indican en los m&rgenes de 
la tabla y los numeros encerrados en un cfrculo son los totales de las celdas. 
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labia 54 Datos de la vida (en horas) del experimento del disefio de la bateria 


Tipo de 





Ibmperatura (°F) 






material 


15 



70 



125 



Vl 

1 

130 

74 

155 

180 


34 

80 

40 

75 

@) 

20 

82 


70 

58 


998 

2 

150 

159 

188 

126 

(@) 

136 

106 

122 

115 

© 

25 

58 


70 

45 

© 

1300 

3 

138 

168 

110 

160 

© 

174 

150 

120 

139 

@) 

96 

82 


104 

60 

© 

1501 

y* 


1738 



1291 



770 



3799 =y.„ 


Las sumas de cuadrados se calculan de la siguiente manera: 

a b n 2 

ss t = 222] y ‘> k ~~afri 


i'*»l 7=1 k=l 


= (130) 2 +(155) 2 +(74) 2 + ••• +(60) 2 -^^- = 77,646.97 


1 a 

ss = - 1 - y v 2 — 

bnizl y ‘- abn 
1 


(3)( 4 )[( 998 ) 2 +(1300) 2 +(1501) 2 ]- (37 3 9 6 9) — 10,683.72 


SS 


Temperature 


an i-i 


i 4 ,. 2 

=i-Y y = -JL 

**» ^ ' J ' abn 


^^[(1738) 2 +(12 9 1) 2 +(770) 2 ]-^|^-= 3!?, 118.72 


yl-4z- ss ^~ ss 


Temperature 

i - i y=i 

1 r, ■> . 1 . . j-is 2 1 (37") 


abn 

) 2 +(22 9 ) 2 

— 3 9 ,118.72 = %13.78 


= ^[(539) 2 +(22 9 ) 2 H — +(342) ]— 3fi 


-10,683.72 


y 


~ ^Material ^Temperature 


-SS 


Interacci6n 


= 77,646.97- 10,683*72- 39,118.72- 9613,78= 18,230,75 


En la tabla 5-5 se muestra el analisis de varianza. Puesto que F Q05 4 2 i = 2.73, se coneluye que hay una in- 
teraccidn significativa entre los tipos del material y la temperatura. Adem£s, F 0 05j2f 27 = 3.35, por lo que los 
efectos principals del tipo de material y la temperatura tambi6n son significativos. En la tabla 5-5 tam- 
bi£n se muestran los valores P para los estadisticos de la prueba. 

Como ayuda para interpretar los resultados de este experimento, es conveniente construir una gr£fi- 
ca de las respuestas promedio para cada combinacidn de los tratamientos, Esta gr£fica se muestra en la fi- 
gura 5-9. El hecho de que las rectas no sean paralelas indica que la interaccidn es significativa. En general, 
se consigue una vida m&s larga con una temperatura baja, independientemente del tipo de material. A1 
cambiar de una temperatura baja a una intermedia, la vida de la bateria con el material tipo 3 tiene un in - 
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Tabla 5-5 AnSlisis de varianza de los datos de la vida de la bateria 


Fuente de 
variacidn 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

Bo 

Valor P 

Tipos de material 

10,683.72 

2 

5,341.86 

7.91 

0.0020 

Temperatura 

39,118.72 

2 

19,559.36 

28.97 

0.0001 

Interaccidn 

9,613.78 

4 

2,403.44 

3.56 

0.0186 

Error 

18,230.75 

27 

675.21 



Tbtal 

77,646.97 

35 





cremento real, mientras que con los materiales tipos 1 y 2 disminuye. Con una temperatura de intermedia 
a alta, la vida de la bateria disminuye para los materiales tipos 2 y 3 y se mantiene en esencia sin cambio 
para el material tipo 1. El material tipo 3 parece producir los mejores resultados si se quiere una pdrdida 
menor de la vida efectiva cuando la temperatura cambia. 


Comparaciones multiples 

Cuando el andlisis de varianza indica que las medias de los renglones o las columnas difieren, por lo gene- 
ral es de interds hacer comparaciones entre las medias individuals de los renglones o las columnas para 
descubrir diferencias espedficas. Los mdtodos de comparaciones multiples revisados en el capitulo 3 son 
utiles a este - respecto. 

Se ilustra ahora el uso de la prueba de TUkey con los datos de la vida de la bateria del ejemplo 5-1. 
Observe que en este experimento, la interaccidn es significativa. Cuando la interaccidn es significativa, las 
comparaciones entre las medias de uno de los factores (por ejemplo. A) pueden ser oscurecidas por la in- 
teraccidnAB. Una forma de abordar esta cuestidn consiste en fijar el factor B en un nivel especifico y apli- 
car la prueba de liikey a las medias del factor A con ese nivel. Para ilustrar, suponga que en el ejemplo 5-1 
el interns se encuentra en detectar las diferencias entre las medias de los tres tipos de material. Puesto 
que la interaccidn es significativa, esta comparacidn se hace con un solo nivel de la temperatura, por 
ejemplo el nivel 2 (70°P). Se supone que la mejor estimacidn de la varianza del error es MS E de la tabla del 
analisis de varianza, utilizando el supuesto de que la varianza del error experimental es la misma para to- 
das las combinaciones de tratamientos. 



Figura 5-9 Gr&fica tipo de material-temperatura para el ejem- 
plo 5-1. 
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Los promedios de los tres tipos de material a 70°F dispuestos en orden ascendente son 

y n ~ 57.25 (material tipo 1) 
y^ = 119.75 (material tipo 2) 
y i2 = 145.75 (material tipo 3) 

y 

-«..<* 27 h]^- 

.3.50^ 

= 4547 

donde <?n o 5 (3, 27) = 3.50 se obtiene por interpolation en la tabla VIII del ap£ndice. Las comparaciones por 
pares dan como resultado 

3 vs. 1: 145.75 * 57.25 = 88.50 > T 005 = 45.47 

3 vs. 2: 145.75 - 119.75 = 26.00 < T oos = 45.47 

2 vs. 1: 119.75 - 57.25 = 62.50 > r 005 = 45.47 

Este an&lisis indica que con el nivel de temperatura de 70°F, la vida media de la bateria es la misma 
para los materiales tipos 2 y 3, y que la vida media de la bateria para el material tipo 1 es significativa- 
mente menor. 

Si la interaccidn es significativa, el experimentador podria comparar las medias de todas las ab celdas 
para determinar cuales difieren significativamente. En este an£lisis, las diferencias entre las medias de las 
celdas incluyen los efectos de la interaccidn, asi como ambos efectos principales. En el ejemplo 5-1, esto 
daria 36 comparaciones entre todos los pares posibles de las nueve medias de las celdas. 


Salida de computadora 

En la figura 5-10 se presenta la salida de computadora de Design-Expert para los datos de la vida de la ba- 
teria del ejemplo 5-1. Observe que 

^^Modelo SS Material ‘^‘^Tfimperatura 3" 55 Interaction 

= 10,68372+ 39,118.72 + 9613.78 
= 59,416.22 


y que 


R 2 


55 . 


55. 


Total 


59,416.22 

77,646.97 


= 0.7652 


Es decir, cerca de 77% de la variabilidad de la vida de la bateria es explicada por el material de la placa de 
la bateria, la temperatura y la interaccidn entre el tipo de material y la temperatura. En la salida de com- 
putadora se muestran tambien los residuales del modelo ajustado. A continuacidn se indica c6mo usar es- 
tos residuales para verificar la adecuaci6n del modelo. 
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Response: Life in hours 

ANOVA for Selected Factorial Model 
Analysis of variance table [Partial sum of squares] 

Sum of Mean 

Source Squares DF Square 

Model 59416.22 8 7427.03 

A 10683.72 2 5341.86 

B 39118.72 2 19559.36 

AB 9613.78 4 2403.44 

Residual 18230.75 27 675.21 

Lack of Fit 0.000 0 

Pure Error 18230.75 27 675.21 

Cor Total 77646.97 35 


Std. Dev. 


25.98 

R-Squared 


0.7652 



Mean 


105.53 

Adj R-Squared 

0.6956 



C.V. 


24.62 

Pred R-Squared 

0.5826 



PRESS 

32410.22 

Adeq Precision 

8.178 



Diagnostics Case Statistics 






Standard 

Actual 

Predicted 



Student 

Cook's 

Outlier 

Order 

Value 

Value 

Residual Leverage 

Residual 

Distance 

t 

1 

130.00 

134.75 

-4.75 

0,250 

-0.211 

0.002 

-0.207 

2 

74.00 

134.75 

-60.75 

0.250 

-2.700 

0.270 

-3,100 

3 

155.00 

134.75 

20.25 

0.250 

0.900 

0.030 

0.897 

4 

180.00 

134.75 

45.25 

0.250 

2.011 

0.150 

2.140 

5 

150.00 

155.75 

”5,75 

0.250 

-0.256 

0.002 

-0,251 

6 

159.00 

155.75 

3.25 

0.250 

0.144 

0,001 

0.142 

7 

188.00 

155,75 

32.25 

0.250 

1.433 

0.076 

1.463 

8 

126.00 

155.75 

-29.75 

0,250 

-1.322 

0.065 

-1.341 

9 

138.00 

144.00 

-6.00 

0.250 

—0.267 

0.003 

-0.262 

10 

168.00 

144.00 

24.00 

0.250 

1.066 

0,042 

1.069 

11 

110.00 

144.00 

-34.00 

0.250 

-1.511 

0.085 

-1.550 

12 

160.00 

144.00 

16.00 

0.250 

0.711 

0.019 

0.704 

13 

34.00 

57.25 

-23.25 

0.250 

-1,033 

0.040 

-1,035 

14 

80.00 

57.25 

22,75 

0.250 

1.011 

0.038 

1.011 

15 

40.00 

57.25 

-17.25 

0.250 

-0,767 

0.022 

—0.761 

16 

75.00 

57.25 

17.75 

0,250 

0.789 

0.023 

0.783 

17 

136.00 

119.75 

16.25 

0.250 

0.722 

0,019 

0.716 

18 

106.00 

119,75 

”13.75 

0,250 

-0,611 

0.014 

-0.604 

19 

122.00 

119.75 

2.25 

0.250 

0.100 

0.000 

0.098 

20 

115.00 

119.75 

-4.75 

0.250 

-0.211 

0.002 

-0.207 

21 

174.00 

145.75 

28,25 

0.250 

1.255 

0.058 

1.269 

22 

150,00 

145.75 

4.25 

0.250 

0,189 

0.001 

0,185 

23 

120.00 

145.75 

-25,75 

0.250 

-1,144 

0.048 

-1.151 

24 

139.00 

145.75 

-6.75 

0.250 

-0.300 

0.003 

-0.295 

25 

20,00 

57.50 

-37.50 

0.250 

-1,666 

0.103 

-1.726 

26 

82.00 

57.50 

24.50 

0.250 

1.089 

0,044 

1.093 

27 

70.00 

57.50 

12.50 

0.250 

0.555 

0.011 

0.548 

28 

58.00 

57.50 

0,50 

0.250 

0.022 

0.000 

0.022 

29 

25.00 

49,50 

-24.50 

0.250 

-1.089 

0.044 

-1.093 

30 

58.00 

49.50 

8.50 

0.250 

0.378 

0.005 

0.372 

31 

70.00 

49.50 

20.50 

0.250 

0.911 

0.031 

0,908 

32 

45.00 

49.50 

-4.5C 

0.250 

-0.200 

0.001 

-0.196 

33 

96.00 

85.50 

10.50 

0.250 

0.467 

0.008 

0,460 

34 

82.00 

85,50 

—3.50 

0.250 

-0,156 

0.001 

-0.153 

35 

104.00 

85.50 

18.50 

0.250 

0,822 

0.025 

0,817 

36 

60.00 

85.50 

-25.50 

0.250 

-1.133 

0.048 

-1.139 


F 

Value Prob > F 

11.00 <0.0001 significant 

7.91 0.0020 

28.97 <0.0001 

3.56 0.0186 


Figura 5-10 Salida de Design-Expert para el ejemplo 5-1. 
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5-3*3 Verificacion de la adecuaci6n del modelo 


Antes de adoptar las conclusiones del analisis de varianza, debera verificarse la adecuacidn del modelo 
fundamental. Como anteriormente, la herramienta primaria de diagnostico es el andlisis residual. Los 
residuales del modelo factorial de dos factores son 

e ijk = Vijk — y ijk (5-11) 

y puesto que el valor ajustado y ijk = y. (el promedio de las observaciones de la celda ij-6 sima), la ecua- 
ci6n 5-11 queda como 

e „ k = y IJk - h ( 5 - 12 ) 

En la salida de computadora de Design-Expert (figura 5-10) y en la tabla 5-6 se muestran los residuales 
de los datos de lavida de la bateria del ejemplo 5-1. La gr£fica de probabilidad normal de estos residua- 
les (figura 5-11) no revela nada particularmente problem&tico, aun cuando el residual negativo mas gran- 
de (-60.75 con 15°F para el material tipo 1) se aparta un poco de los dem£s. El valor estandarizado de este 
residual es -60.75/V675.21 = -2.34, y es el unico residual cuyo valor absoluto es mayor que 2, 

En la figura 5-12 se grafican los residuales contra los valores ajustados y ijk . Esta gr&fica indica una li- 
gera tendencia de la varianza de los residuales aincrementarse cuando lavida de la bateria se incrementa. 
En las figuras 5-13 y 5-14 se grafican los residuales contra los tipos del material y la temperatura, respecti- 
vamente. Ambas graficas indican una ligera desigualdad de la varianza, con la combinacidn del trata- 
miento 15°F y material tipo 1, teniendo posiblemente una varianza mayor que las dem&s. 

En la tabla 5-6 se observa que la celda 15°F-material tipo 1 contiene los dos residuales extremos 
(-60.75 y 45.25). Estos dos residuales son los principales responsables de la desigualdad de la varianza de- 
tectada en las figuras 5-12 a 5-14. A1 examinarse nuevamente los datos no se observa ningun problema ob- 
vio, tal como un error al registrar los datos, por lo que estas respuestas se aceptan como legltimas. Es 
posible que esta combinacirin de tratamientos particular produzca una vida de la bateria ligeramente mas 
erratica que las dem&s. Sin embargo, el problema no es lo suficientemente grave como para tener un im- 
pacto dram&tico en el an&lisis y las conclusiones. 

5-3*4 Estimacidn de los parametros del modelo 

Los parametros del modelo de los efectos para el diseno factorial de dos factores 

y V k = +t i + Pj + ( T P)n +E ijk ( 5_13 ) 


labia 5-6 Residuales del ejemplo 5-1 


Tipo de 

material 15 


Tfemperatura (°F) 
~70 ” 


125 


-4.75 

20.25 

-23.25 

-17.25 

-37.50 

12.50 

-60.75 

45.25 

22.75 

17.75 

24.50 

0.50 

-5.75 

32.25 

16.25 

2.25 

-24.50 

20.50 

3.25 

-29.75 

-13.75 

-4.75 

8.50 

-4.50 

-6.00 

-34.00 

28.25 

-25.75 

10,50 

18.50 

24.00 

16.00 

4,25 

-6.75 

-3.50 

-25.50 


3 
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pueden estimarse por minimos cuadrados. Puesto que el modelo tiene 1 + a + ab parametros que deben 
estimarse, hay 1 + a + b + ab ecuaciones normales. A1 utilizar el raetodo de la seccion 3-9, no es dificil de- 
mostrar que las ecuaciones normales son 

a b a b A 

ft: abnfii + bn^ t . + fi * + n EE ( 5 - 14a ) 

i=\ j=\ i=i j=l 



Figura 5-12 Grlfica de los residuales contra y yk para el ejemplo 5-1. 
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Figure 5-13 Gr&fica de los residuales contra el tipo de mate- 
rial para el ejemplo 5-1. 


T i :bnfi+bnt i +nj 3, +n 2( t 0) # “ A. * = (5-14b) 

i-1 i=l 

a a 

pjianpt+n J t, +anp j +«]£(t0). = y h j=l,2 > ...,b (5-14c) 

i-1 i*l 

(tp) y :nfi+nf l +nfi j +n(Tp)^ - y* ( 5 ' 14d ) 

Por conveniencia, el pariunetro que corresponde a cada ecuacidn normal se indica a la izquierda de las 
ecuaciones 5-14. 



Figure 5-14 Gr&fica de los residuales contra la temperature 
para el ejemplo 5-1. 
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El modelo de los efectos (ecuacibn 5-13) est£ sobreparametrizado. Observe que la suma de las a 
ecuaciones de la ecuacibn 5-14b es igual a la ecuacibn 5-14ay que la suma de las b ecuaciones de la ecua- 
ci6n 5-14c es igual a la ecuacibn 5-14a. Asimismo, la operacion suma de la ecuacion 5-14d sobre j para una 
i particular dara la ecuacibn 5-14b, y la operadbn suma de la ecuacibn 5-14d sobre i para una j particular 
darfi la ecuacibn 5-14c. Por lo tanto, hay a + b + 1 dependencias lineales en este sisteraa de ecuaciones y 
no existird ninguna solucibn unica. A fin de obtener una solucibn, se imponen las restricciones 


o 

II 

(5-15a) 

2 K-o 

(5-15b) 

M 


2 (A, = 0 1 = 1,2 ,..., b 

1=1 

(5-15c) 

i (tK= 0 * = 1> 2,..., a 

y= 1 

(5-15d) 


Las ecuaciones 5-15a y 5-15b constituyen dos restricciones, mientras que las ecuaciones 5-15c y 5-15d for- 
man a + b - 1 restricciones independientes. Por lo tanto, se tienen en total a + b + 1 restricciones, el nu- 
mero que se requiere. 

A1 aplicar estas restricciones, las ecuaciones normales (ecuaciones 5-14) se simplifican considerable- 
mente, y se obtiene la solucibn 


A = y... 
l = y L - y... 


= y v .-yi..- 


i = 1, 2, ...,a 
. fi = l,2 


(5-16) 


Observe el gran atractivo intuitivo de esta soludbn de las ecuaciones normales. Los efectos de los trata- 
mientos de los renglones se estiman con el promedio del renglbn menos el gran promedio; los tratamien- 
tos de las columnas se estiman con el promedio de la columna menos el gran promedio, y la interaccibn 
ij'-bsima se estima con el promedio de la celda ij-6 sima menos el gran promedio, el efecto del renglbn i-6 si- 
mo y el efecto de la columna j'-bsima. 

A1 utilizar la ecuacibn 5-16, el valor qjustado y ijk puede encontrarse como 

9ijk = fr + *i + fij + (rf)ij 

= y... -y..)+(y._j.-y...) 

+iy i j.-y i ..-yj. + y,.) 

= h 

Es decir, la observacibn /c-6sima de la celda ij-6 sima se estima con el promedio de las n observaciones de 
esa celda. Este resultado se uso en la ecuacibn 5-12 para obtener los residuales del modelo factorial de 
dos factores. 

Puesto que se han usado restricciones (ecuaciones 5-15) para resolver las ecuaciones normales, los 
pardmetros del modelo no tienen estimaciones unicas. Sin embargo, ciertas funciones importantes de 
los par&metros del modelo son estimables, es decir, tienen una estimacibn unica independientemente de 
las restricciones elegidas. Un ejemplo es r, - r„ + (i/5), - (rp) u ,, que podria considerarse como la “verdade- 
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ra” diferencia entre los niveles i-6simo y u-csimo del factor .4. Observe que la verdadera diferencia entre 
los niveles de cualquier efecto principal incluye un efecto de la interaccidn “promedio”. Es este resultado 
el que perturba las pruebas de los efectos principales en presencia de una interaccidn, como se senald an- 
teriormente. En general, cualquier funcion de los par&metros del modelo que sea una combination lineal 
del miembro izquierdo de las ecuaciones normales es estimable. Esta propiedad tambidn se hizo notar en 
el capitulo 3 cuando se estudid el modelo de un solo factor. Para mayores detalles, ver el material suple- 
mentario del texto de este capitulo. 

5-3.5 Eleccidn del tamano de la muestra 

Para determinar un tamaiio de la muestra (el numero de rdplicas, n) apropiado en un diseno factorial de 
dos factores, el experimentador puede apoyarse en las curvas de operacidn caracterfstica que aparecen en 
la parte V del apdndice. En la tabla 5-7 se muestra el valor apropiado del parametro <& 2 , asi como los gra- 
dos de libertad del numerador y el denominador. 

Una forma muy eficaz de emplear estas curvas consiste en encontrar el valor menor de O 2 que corres- 
ponde a una diferencia especificada entre las medias de dos tratamientos cualesquiera. Por ejemplo, si la 
diferencia en las medias de dos renglones cualesquiera es D, entonces el valor minimo de <b 2 es 

0 2 =^ (5-17) 

2aa 

mientras que si la diferencia en las medias de dos columnas cualesquiera es D, entonces el valor minimo 
de <b ? es 

(548) 

Por ultimo, el valor minimo de O 2 que corresponde a una diferencia D entre dos efectos de interaccidn 
cualesquiera es 


2a 2 [(a-l)(6-l)+l] 


(5-19) 


Para ilustrar el uso de estas ecuaciones, considere los datos de la vida de la bateria del ejemplo 5-1. 
Suponga que antes de correr el experimento se decide que la hipdtesis nula debera rechazarse con una alta 


labia 5*7 Par&metros de la curva de operacidn caracterfstica de la parte V del ap^ndice para el disefto factorial 
de dos factores, modelo con efectos fijos 


Factor 


& 

Grados de libertad 
del numerador 

Grados de libertad 
del denominador 

rf 

i=l 

a -1 

ab(n- 1) 

ao 2 




b~ 1 

ab(n -1) 

bo 2 



it m 

1=1 7-1 

(a-m - 1 ) 

ab(n- 1) 


a 2 [(a -l)(ft -1)+1] 
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probabilidad si la diferencia en la vida media de la bateria entre dos temperaturas cualesquiera es hasta 
de 40 horas. Por lo tanto D - 40,ysi se supone que la desviacion est&ndar de la vida de la bateria es apro- 
ximadamente 25, entonces por la ecuacidn 5-18 se obtiene 

2 bo 2 

_ K3)(40) 2 
2(3)(25) 2 
= 1.28m 

como el valor minimo de d >2 . Suponiendo que a — 0.05, ahora puede usarse la parte V del apendice para 
construir la tabla siguiente: 
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delo sin interaction (ecuaciOn 5-20). Como ya se senalO, los dos efectos principales son significativos. Sin 
embargo, tan pronto como se efectua el an&lisis residual de estos datos, se pone de manifiesto que el mo- 
delo sin interaction es inadecuado. Para el modelo de dos factores sin interaction, los valores ajustados 
son y ijk = y, + y y -y . En la figura 5-15 se presenta la gr&fica dey, ; - y ijk (los promedios de las celdas menos 
el valor ajustado de esa celda) contra el valor ajustado y ijk . Ahora las cantidadesy# - pueden conside- 
rarse como las diferencias entre las medias de las celdas observadas y las medias de las celdas estimadas 
suponiendo que no hay interaction. Cualquier patrOn en estas cantidades sugiere la presentia de una in- 
teraction. En la figura 5-15 se observa un patrOn claro cuando las cantidades y„ - y ijk pasan de positivo a 
negativo, y despuds de nuevo a positivo y a negativo. Esta estmctura es el resultado de la interaction entre 
los tipos del material y la temperatura. 


5-3.7 Una observation por celda 

En ocasiones se encuentran experimentos de dos factores con una sola rdplica, es detir, en los que sOlo 
hay una observation por celda. Cuando hay dos factores y una sola observation por celda, el modelo de 
los efectos es 


y» = f*+*i +Pj +(*£)«, +*# 


i = l,2,..., a 
L/ = 1) 2, . . & 


(5-21) 


El an&lisis de varianza para esta situation se presenta en la tabla 5-9, suponiendo que ambos factores son 
fijos. 

A1 examinar los cuadrados medios esperados, se observa que la varianza del error a 2 es no estimable; 
es decir, que el efecto de la interaction de los dos factores (r/?), y y el error experimental no pueden sepa- 
rate de alguna manera obvia. Por consiguiente, no se cuenta con pruebas para los efectos principales a 
menos que el efecto de la interaction sea cero. Si no bay una interaction presente, entonces (r/3), y = 0 para 
toda t y j, y un modelo plausible es 


=n+T i +p j +e ij 


i = l, 2 ,..., a 

j= 1,2,..., b 


(5-22) 


Si el modelo (ecuatiOn 5-22) es apropiado, entonces el cuadrado medio de los residuales de la tabla 5-9 es 
un estimador insesgado de o 2 , y los efectos principales pueden probarse comparando MS A y MS s con 

bfS Rraidual- 
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labia 5'9 AnSlisis de variama de un modelo de dos factores, una observacidn por celda 


Fuente de 
variacidn 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

Cuadrado medio 
esperado 

Renglones {A) 

Y yl_yl 

b ab 

a -1 

ms a 

a- 1 

Columnas ( B ) 

y Zl_zl 

ft a ab 

b- 1 

ms b 

b~ 1 

Residual o AB 

Sustraccidn 

(*-l)(6-l) 

^^Residual 

, . 2 2<'« 

Total 

a b 2 

yy yt-iL 

hft y " ab 

ab- 1 




Una prueba desarrollada por Thkey [111a] es util para determinar si est& presente una interaccidn. 
En el procedimiento se supone que el tdrmino de la interaccion tiene una forma particularmente simple, 
a saber. 


00 )# = Y*iPi 


donde y es una constante desconocida. A1 definir asi el term i no de la interaccion, puede usarse un enfo- 
que de regresidn para probar la signification del tdrmino de la interactidn. En la prueba se hace la parti- 
cidn de la suma de cuadrados de los residuales en un componente con un solo grado de libertad debido a 
la no aditividad (interaccion) y un componente del error con (a -1)(£>— 1) — 1 grados de libertad. En lo que 
a los c&lculos se refiere, se tiene 




22 y^yj-y.. 

/=» >=i 


SS A +SS B +~ 
A B ab 


abSS A SS B 


(5-23) 


con un grado de libertad, y 


^Enor — ^Residual ^S N 


(5-24) 


con ( a - l)(h -1) - 1 grados de libertad. Para probar la presencia de una interaccidn, se calcula 

SS„ 


^/[(fl-lX^-l)-!] 


(5-25) 


Si F 0 > F a> (fl _ 1)(t debe rechazarse la hipotesis de que no hay ninguna interaccidn. 


EJEMPLO 5-2 

Las impurezas presentes en un producto quimico son afectadas por dos factores, la presidn y la tempera- 
tura. En la tabla 5-10 se muestran los datos de una sola rdplica de un experimento factorial. Las sumas de 
cuadrados son 



= i[23 2 +13 z +8 2 ]- 


44 2 
(3)(5) 


= 23.33 
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Tabla 5*10 Datos de las impurezas del ejemplo 5-2 


Ibmperatura 

(°F) 



Fresi6n 



25 

30 

35 

40 

45 

yi 

100 

5 

4 

6 

3 

5 

23 

125 

3 

1 

4 

2 

3 

13 

150 

1 

1 

3 

1 

2 

8 

y.i 

9 

6 

13 

6 

10 

44 


i b v 2 

1 


2 

ab 

2 ,i^2 


AA 2 

2 ‘ inJl = 11.60 


= j[9 +6 +13 +6* +10*]- (3)(5) 


SS r = 2 

i = 1 /-I 

= 166— 129.07 = 36.93 


x 


^Residual ” *^T 


36.96-2333-11.60= ZOO 
La suma de cuadrados de la no aditividad se calcula con la ecuacidn 5-23 de la siguiente manera: 


a b 


22 y^y-J =(5)(23)(9)+(4)(23)(6)+ +(2)(8)(10)= 7236 


/=1 j -1 


SS N = 


22 yw .1 ~ y ss * +ss * + 


i- 1 J= 1 


ab 


12 




[7236-(44)(23L33+11.60+129.07)] 1 

(3)(5)(2333)(11.60) 

0.0985 

4059.42 


y la s um a de cuadrados del error es, por la ecuacidn 5-24, 

^ Error = ^Ronidual “ SS„ 

= 2.00 - 0.0985=1.9015 

El an^lisis de varianza completo se resume en la tabla 5-11. El estadistico de prueba para la no aditivi- 
dad esf 0 = 0.0985/0.2716 = 0.36, de donde se concluye que no hay evidencia de interaccidn en estos da- 
tos. Los efectos principals de la temperatura y la presidn son significativos. 


Para concluir esta seccion, se hace notar que el modelo factorial de dos factores con una observation 
por celda (ecuacidn 5-22) luce exactamente igual que el modelo de bloques completos aleatorizados 
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Tabla 5-11 Anfllisis de varianza del ejemplo 5-2 


Fuente de 
variacidn 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

F o 

Valors 

Tfemperatura 

23*33 

2 

11.67 

42.97 

0,0001 

Presidn 

11.60 

4 

2.90 

10.68 

0.0042 

No aditividad 

0.0985 

1 

0.0985 

0.36 

0.5674 

Error 

1*9015 

7 

0.2716 



Tbtal 

36*93 

14 





(ecuacion 4-1). De hecho, la prueba de Tukey con un solo grado de libertad para la no aditividad puede 
aplicarse directamente para probar la presencia de una interaccidn en el modelo de bloques aleatoriza- 
dos. Sin embargo, es necesario recordar que las situaciones experimentales que llevan al modelo de blo- 
ques aleaiorizados y al modelo factorial son muy diferentes. En el modelo factorial, todas las ab corridas 
se hacen de manera aleatoria, mientras que en el modelo de bloques aleatorizados la aleatorizacidn s61o 
ocurre dentro del bloque. Los bloques constituyen una restriccidn sobre la aleatorizacidn. Por lo tanto, la 
manera en que se corren los experimentos, asi como la interpretatidn de los dos modelos, es muy diferente. 

& 


5-4 DISENO FACTORIAL GENERAL 

Los resultados del diseno factorial de dos factores pueden ampliarse al caso general en que hay a niveles 
del factor .<4, b niveles del factor B, c niveles del factor C, etc., dispuestos en un experimento factorial. En 
general, habrd abc — n observaciones totales si se hacen n rdplicas del experimento completo. De nueva 
cuenta, observe que es necesario un minimo de dos rdplicas (n > 2) para determinar una suma de cuadra- 
dos debida al error si todas las interacciones posibles estan incluidas en el modelo. 

Cuando todos los factores del experimento son fijos, es sencillo formular y probar hipdtesis acerca de 
los efectos principales y las interacciones. Para un modelo con efectos fijos, los estadisticos de prueba 
para cada efecto principal e interaccidn pueden construirse dividiendo el cuadrado medio correspondien- 
te del efecto o interaction por el cuadrado medio del error. Ibdas estas pruebas F ser&i de una cola supe- 
rior. El numero de grados de libertad de cualquier efecto principal es el numero de niveles del factor 
menos uno, y el numero de grados de libertad de una interaccidn es el producto del numero de grados de 
libertad asociados con los componentes individuates de la interaction. 

Por ejemplo, considere el modelo del andlisis de varianza de tres factores: 


y$ U =M+^, +Pj +Yk H T P)a + ( T Y)ik HPv)jk 


+ ( tpy )p ! 


i = 1, 2,..., a 
7 = 1, 2, ..., b 
fc = l, 2,...,c 
/=1, 2,..., n 


(5-26) 


Suponiendo que A, ByC son fijos, la tabla del analisis de varianza se presenta en la tabla 5-12. Las prue- 
bas F para los efectos principales y las interacciones se siguen directamente de los cuadrados medios es- 
perados. 



labia 5*12 La tabla del an£lisis de variama del modelo de ties factores con efectos £jos 
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En general, los calculos del an&lisis de varianza se efectuarian utilizando un paquete de software de 
estadistica. Sin embargo, en ocasiones resultan utiles las formulas para calcular manualmente las sumas 
de cuadrados de la tabla 5-12. La suma de cuadrados total se encuentra de la manera acostumbrada como 


i = 1 j=l k - 1 i= 1 


abcn 


(5-27) 


Las sumas de cuadrados de los efectos principales se encuentran a partir de los totales de los factores 
A(y L ), Bfyj) y C{y k ) de la siguiente manera: 


' L% rL 
1 — 

SS B = Y y) - 

® nrn ' * 


aCn %l 


ss c " tl: Z, x 


Y 


x 2 . 

abcn 

(5-28) 

2 

abcn 

(5-29) 

__2 

abcn 

(5-30) 


abn " k ‘ abcn 

Para calcular las sumas de cuadrados de las interacciones de dos factores, se necesitan los totales de las 
celdas^4 x B,A x C y B x C. Con frecuencia es util desplegar la tabla de los datos originales en tres tablas 
de dos vias para calcular estas cantidades. Las sumas de cuadrados se encuentran con 


SS w = — yy yl -^r~-SS A -SS 


cntSjTi 


~ ^Subtotales (AB) A SS ff 


= ss 


Subtotales ( /4C ) 


abcn 

-55, -SS r 


(5-31) 


(5-32) 


^^ n 2±yi,-±- n -ss,-ss c 


~ ^Subtotales (BC) SS C 


(5-33) 

Observe que las sumas de cuadrados de los subtotales de dos factores se encuentran a partir de los totales 
de cada tabla de dos vias. La suma de cuadrados de la interaccion de los tres factores se calcula a partir de 
los totales de las celdas {y ijk } de tres vias como 

55^ yl -^-^-55 fl -55 c -55^-55^ -SS BC (5-34a) 

= S3 Subtotales (ABC) ~ A ~ ^5 “ ~ AB ~ ^ AC ~~ $$BC (5-34t>) 

La suma de cuadrados del error puede encontrarse restando la suma de cuadrados de cada efecto princL 
pal e interaccion de la suma de cuadrados total o con 

SS £ — SS T — SS § u ktotales i( ABC ) (5-35) 
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EJEMPLO 

El problema del embotellado de un refresco 

Una empresa embotelladora de refrescos esta interesada en obtener alturas de llenado m£s unifonnes en 
las botellas que se fabrican en su proceso de manufactura. Tedricamente, la m£quina de llenado Uena cada 
botella a la altura objetivo correcta, pero en la pr£ctica, existe variacidn en tomo a este objetivo, y a la embo- 
telladora le gustaria entender mejor las fuentes de esta variabilidad y, en ultima instancia, reducirla. 

El ingeniero del proceso puede controlar ties variables durante el proceso de llenado: el porcentaje 
de carbonatacidn ( A ), la presidn de operacidn en el llenador (5) y las botellas producidas por minuto o ra- 
pidez de lfnea (C). Es sencillo controlar la presidn y la rapidez, pero el porcentaje de carbonatacion es 
mas dificil de controlar durante la manufactura real debido a que varia con la temperatura. Sin embargo, 
para los fines de un experimento, el ingeniero puede controlar la carbonatacidn en tres niveles: 10, 12 y 14 
por ciento. Elige dos niveles para la presidn (25 y 30 psi) y dos niveles para la rapidez de linea (200 y 250 
bpm). El ingeniero decide correr dos rdplicas de un diseno factorial con estos tres factores, haciendo las 
24 corridas de manera aleatoria. La variable de respuesta observada es la desviacidn promedio de la altu- 
ra del llenado objetivo que se observa en una corrida de production de botellas con cada conjunto de con- 
ditions, En la tabla 5-13 se muestran los datos que resultaron de este experimento. Las desviaciones 
positivas son alturas de llenado arriba del objetivo, mientras que las desviaciones negativas son alturas de 
llenado abajo del objetivo. Los numeros encerrados en circulos de la tabla 5-13 son los totales de las cel- 
das de tres vias y ijkr 

La suma de cuadrados total corregida que se encuentra con la ecuacidn 5-27 es 

a b c n 2 


=1 j = 1 k = 1 /-I 


= 571 — ' 


-336.625 


Tabla 5-13 Datos de la desviaci6n de la altura de llenado del ejemplo 5-3 

Presidn de operacidn ( B ) 

25 psi 

Porcentaje de Rapidez de lmea (Q F 

carbonatacidn (A) 200 250 2 


30 psi 

Rapidez de linea (C) 



Tbtales B x Cy jk 

y±_ 


Tbtales^4 x B 


Totales A x C 



y*. 



yut 



B 



c 


A 

25 

30 

A 

200 

250 

10 

-5 

1 

10 

-5 

1 

12 

4 

16 

12 

6 

14 

14 

22 

37 

14 

25 

34 


75 
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y las sumas de cuadrados de los efectos principales que se calculan con las ecuaciones 5-28, 5-29 y 5-30 son 

ss =— y v 2 

c ** om * ci6n ben £ y> - aben 

= ^[(-4) 2 +(20) 2 +(59) 2 ]- = 252.750 

SSpKti6D = ^ 2 y2j ~~at^i 

= ^[(21) 2 +(54) 2 ]-^=45.375 


y 


55 


Rapidez 


y 


abnfa 


A 



aben 


-^[(26) ! +(49) ! J-^ 


= 22.042 


Para calcular las sumas de cuadrados de las interacciones de dos factores, se deben encontrar los tota- 
les de las celdas de dos vfas. Por ejemplo, para encontrar la carbonatacion-presidn o interaction AB, se 
necesitan los totales de las celdas ^4 x B (y, y } que se muestran en la tabla 5-13. Utilizando la ecuacidn 
5-31, se encuentra que las sumas de cuadrados son 


55. 


1 a b 

yl- 


i=i j=i 


y 2 

~~-ss A -ss B 

aben 


- ^[(“5) 2 +( 1 ) 2 +(4) 2 +(16) 2 +(22) 2 +(37) 2 ]- ^ — 252 750 - 45.375 
= 5.250 


Para la carbonatacidn-rapidez o interaction ^4C se usan los totales de las celdas^ x C iy Lk } que se mues- 
tran en la tabla 5-13 y la ecuacidn 5-32: 

^c-£tiyL-£-ss A -ss c 


i=i *=i 

1 
4 

= 0.583 


= 7 [(-5) 2 +(1) 2 +(6) 2 +(14) 2 +(25) 2 +(34) 2 ]-^§ — 252.750 - 22.042 


24 


La presidn-rapidez o interaccidn BC se encuentra con los totales de las celdas B x C {y jk } que se mues- 
tran en la tabla 5-13 y la ecuacidn 5-33: 


— 22 y* 


an 


j = 1 k=l 


v 2 

~ — SS B -SS C 
aben B c 


= -^K 6 ) 2 +( 15 ) 2 +(20) 2 +(34) 2 — 45.375- 22.042 

= 1.042 
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La suma de cuadrados de la interaccidn de los tres factores se encuentra con los totales de las celdas 
A x B x C }, los cuales estan encerrados en un circulo en la tabla 5-13. Por la ecuacidn 5-34a se en- 
cuentra 

yk--^-ssA-ss B -ss c -ss M -ss AC -ss ae 

= |[(-4) 2 +(-l) 2 +(-l) 2 +-+(16) 2 +(21) 2 ]- 

- 252.750- 45.375- 22042- 5.250 - 0.583- 1.042 
= 1.083 


Por Ultimo, al observar que 

SS 


= iwv 

n ■ 


Subtotals (ABC ) „ Zj Zj Zj Q ^ cn 


i-l ;=1 *= 1 


328.125 


se tiene 

SS E — SS T — 5' 1<> ;, u bi„ia]cs(.-lK() 

= 336.625- 328.125 
= 8.500 

En la tabla 5-14 se resume el analisis de varianza. Se observa que el porcentaje de carbonatacidn, la 
presi6n de operacidn y la rapidez de linea afectan significativamente el volumen de Uenado. El cociente F 
de la interaccion carbonataci6n-presi6n tiene un valor P de 0.0558, lo cual indica cierta intcraccion entre 
estos factores. 

El siguiente paso debera ser un analisis de los residuales de este experimento. Se deja como ejercicio 
para el lector, pero se senala que la grafica de probabilidad normal de los residuales y los dem£s diagnds- 
ticos usuales no indican ningun motivo de preocupacidn importante. 

Como ayuda para la interpretadon prActica de este experimento, en la figura 5-16 se grafican los tres 
efectos principales y la interaccirinAB (carbonatacion-presibn). Las representaciones de los efectos princi- 
pales son sdlo graficas de los promedios de las respuestas marginales para los niveles de los tres factores. 
Observe que las tres variables tienen efectos principales positivos; es decir, el incremento de la variable 
mueve hacia arriba la desviacidn promedio del llenado objetivo. La interacddn entre la cabonataddn y la 
presion es bastante pequena, como lo indica la forma similar de las dos curvas de la figura 5-16 d. 

Puesto que la empresa quiere que la desviacion promedio del llenado objetivo est6 cerca de cero, el 
ingeniero decide recomendar el nivel bajo de la presion de operacion (25 psi) y el nivel alto de la rapidez 
de linea (250 bpm, que maximizard la rapidez de produccidn). En la figura 5-17 se grafica la desviacion 


Tabla 5-14 Analisis de varianza del ejemplo 5-3 


Fuente de variacidn 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

^0 

Valor P 

Porcentaje de carbonatacidn (A) 

252.750 

2 

126.375 

178.412 

<0.0001 

Presibn de operaci6n (5) 

45.375 

1 

45.375 

64.059 

<0.0001 

Rapidez de Imea (C) 

22,042 

1 

22.042 

31.118 

0.0001 

AB 

5,250 

2 

2.625 

3.706 

0.0558 

AC 

0.583 

2 

0,292 

0.412 

0.6713 

BC 

1.042 

1 

1.042 

1.471 

0.2485 

ABC 

1.083 

2 

0.542 

0.765 

0.4867 

Error 

8.500 

12 

0.708 


Ibtal 

336.625 

23 







Figure 5-16 Gr£ficas de los efectos principals y la interaccibn del 
ejemplo 5-3. a) Porcentaje de carbonatacibn (4), b ) presibn (#), c) ra- 
pidez de linea (C), d) interaccibn carbonatacibn-presibn. 


proraedio observada de la altura de llenado objetivo con los tres diferentes niveles de carbonatacibn para 
este conjunto de condiciones de operation. Ahora, el nivel de la carbonatacion no puede actualmente 
controlarse perfectamente en el proceso de manufactura, y la distribution normal indicada con la linea 
continua de la figura 5-17 es una aproximacion de la variabilidad de los niveles de carbonatacion que se 



10 12 14 

Porcentaje de carbonatacibn (A) 


Figura 5-17 Desviacibn promedio de la altura de llenado 
con rapidez alta y presibn baja para diferentes niveles de 
carbonatacibn. 
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registran actuahnente. Como el proceso es impactado por los valores del nivel de carbonatacidn sacado 
de esta distribucion, la fluctuacRm de las alturas de llenado sera considerable. Esta variabilidad de las al- 
turas de llenado podria reducirse si la distribucidn de los valores del nivel de carbonatacion siguieran la 
distribucion normal indicada con la linea punteada de la figura 5-17. La reduction de la desviacion estan- 
dar de la distribution del nivel de carbonatacion se consiguio finalmente mejorando el control de la tem- 
peratura durante la manufactura. 


Se senalO ya que si todos los factores de un experimento factorial son fijos, la construction del esta- 
distico de prueba es directa. El estadistico para probar cualquier efecto principal o interaction se forma 
siempre dividiendo el cuadrado medio del efecto principal o la interaccion por el cuadrado medio del 
error. Sin embargo, si el experimento factorial incluye uno o mas factores aleatorios, la construction del 
estadfstico de prueba no siempre se hace de esta manera. Es necesario examinar los cuadrados medios es- 
perados para determinar las pruebas correctas. La revision completa de los experimentos con factores 
aleatorios se pospone hasta el capftulo 12. 


5-5 AJUSTE DE CURVAS Y SUPERFICIES DE RESPUESTA 

Se ha visto que puede resultar util ajustar una curva de respuesta a los niveles de un factor cuantitativo 
para que el experimentador cuente con una ecuaciOn que relacione la respuesta con el factor. Esta ecua- 
ci6n podria utilizarse para hacer interpolaciones, es decir, para predecir la respuesta en niveles interme- 
dios entre los factores, respecto de los que se utilizaron realmente en el experimento. Cuando al menos 
dos de los factores son cuantitativos, puede ajustarse una superficie de respuesta para predecir y con va- 
rias combinaciones de los factores del diseno. En general, se usan metodos de regresidn lineal para ajus- 
tar estos modelos a los datos experimentales. Este procedimiento se ilustra en la secciOn 3-5.1 para un 
experimento con un solo factor. A continuation se presentan dos ejemplos que incluyen experimentos 
factoriales. Se utilizarir un paquete de software de computadora para generar los modelos de regresion. 
Para mayor information acerca del analisis de regresion, referirse al capitulo 10 y al material suplementa- 
rio del texto de este capftulo. 


EJEMPLO 5-4 

Considere el experimento que se describe en el ejemplo 5-1. El factor temperatura es cuantitativo y el tipo 
de material es cualitativo. Adem&s, hay tres niveles de la temperatura. Por consiguiente, puede calcularse 
un efecto de la temperatura lineal y uno cuadrOtico para estudiar la forma en que la temperatura afecta la 
vida de la bateria. En la tabla 5-15 se presenta la salida condensada de Design-Expert para este experimen- 
to, donde se supone que la temperatura es cuantitativa y el tipo de material es cualitativo. 

El anOlisis de varianza de la tabla 5-15 indica que la fuente de variabilidad “modelo” se ha subdividi- 
do en varios componentes. Los componentes “A”y“A 2 ” representan los efectos lineal y cuadratico de 
la temperatura, y “B” representa el efecto principal del factor tipo de material. Recuerde que el tipo de ma- 
terial es un factor cualitativo con tres niveles. Los terminos “AB” y “A 2 B” son las interacciones del factor tem- 
peratura lineal y cuadratico con el tipo de material. 

Los valores P indican queA 2 yAB no son significativos, mientras que el terminori 2 B es significativo. 
Con frecuencia se piensa en eliminar los tOrminos o factores no significativos del modelo, pero en este 



Tabla 5 '15 Salida de Design-Expert para el ejemplo 5 '4 


Response; Life in hr 


ANOVA for Response Surface Reduced Cubic Model 
Analysis of variance table [Partial sum of squares] 



Sum of 


Mean 

F 


Source 

Squares 

DF 

Square 

Value 1 

Prob > F 

Model 

59416.22 

8 

7427.03 

11.00 

<0.0001 

A 

39042.67 

1 

39042.67 

57.82 

<0.0001 

B 

10683.72 

2 

5341.86 

7.91 

0.0020 

A 2 

76.06 

1 

76.06 

0.11 

0.7398 

AB 

2315.08 

2 

1157.54 

1.71 

0.1991 

A 2 B 

7298.69 

2 

3649.35 

5.40 

0.0106 

Residual 

18230.75 

27 

675.21 



Lack of Fit 

0.000 

0 




Pure Error 

18230.75 

27 

675.21 



Cor Total 

77646.97 

35 




Std, Dev. 

25.98 


R-Squared 

0.7652 

Mean 

105.53 


Adj R-Squared 

0.6956 

C.V. 

24.62 


Fred R-Squared 

0.5826 

PRESS 

32410.22 


Adeq Precision 

8.178 


Coefficient 


Standard 

95% Cl 

95% Cl 

Term 

Estimate 

DF Error 

Low 

High 

Intercept 

107.58 

1 

7.50 

92.19 

122.97 

ATemp 

-40.33 

1 

5.30 

-51.22 

-29,45 

B[1] 

-50.33 

1 

10.61 

-72.10 

-28.57 

B[2] 

12.17 

1 

10.61 

-9,60 

33.93 

A 2 

-3.08 

1 

9.19 

-21.93 

15.77 

AB11] 

1.71 

1 

7.50 

-13.68 

17,10 

AB[2] 

-12.79 

1 

7.50 

-28.18 

2.60 

A 2 B[1] 

41.96 

1 

12.99 

15.30 

68.62 

A 2 B[2] 

-14.04 

1 

12.99 

-40.70 

12.62 


significant 


VIF 

1.00 


1.00 


Final Equation in Terms of Coded Factors: 

Life = 

+ 107.58 
-40.33 *A 
-50.33 *B[1] 

+ 12.17 *B[2] 

-3.08 *A 2 
+ 1.71 *AB[1] 

-12.79 *AB[2] 

+41.96 *A 2 B[1] 

-14.04 *A 2 B[2] 


Final Equation in Terms of Actual Factors: 
Material Type 1 
Life = 

+ 169.38017 

-2.48860 *Temp 
+0.012851 *Temp 2 


Material Type 2 

Life = 

+ 159.62397 

-0.17901 *Temp 
+0.41627 *Temp 2 

Material Type 3 

Life « 

+ 132.76240 
+0.89264 *Temp 
-0.43218 *Temp 2 
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caso eliminar^yAfi y conservarj4 2 fi resultarS en un modelo que no es jer&rquico. El principio de jerar- 
quia establece que si un modelo contiene un tdrmino de orden superior (tal como^4 2 fi), deber£ contener 
tambi6n todos los terminos de orden inferior que lo componen (j4 2 yAB en este caso). La jerarquia pro- 
mueve un tipo de consistencia interna en un modelo, y muchos constructores de modelos estadisticos si- 
guen rigurosamente este principio. Sin embargo, la jerarquia no es siempre una buena idea, y muchos 
modelos en realidad funcionan mejor como ecuaciones de prediction que no incluyen los terminos no sig- 
nificativos que propone la jerarquia, Para mayor informackm, ver el material suplementario del texto de 
este capitulo. 

La salida de computadora incluye tambi6n estimaciones de los coeficientes del modelo y una ecua- 
ci6n para la prediccidn final de la vida de la bateria en terminos de factores codificados. En esta ecuacidn, 
los niveles de la temperatura sonj4 = -1, 0, -l- 1, respectivamente, cuando la temperatura est£ en los nive- 
les bajo, intermedio y alto (15, 70, 125°F). Las variables fi[l] y fi[2] son variables indicadoras codificadas 
que se definen de la siguiente manera: 



Tipo 

de material 


1 

2 

3 

B[l] 

1 

0 

-1 

B[2] 

0 

1 

-1 


Hay tambi6n ecuaciones para la prediccidn de la vida de la bateria en tdrminos de los niveles de los facto- 
res reales. Observe que como el tipo de material es un factor cualitativo, hay una ecuacidn para la vida 
predicha como una funci6n de la temperatura para cada tipo de material. En la figura 5-18 se muestran 



Figure 5-18 La vida predicha como una funcidn de la temperatura para los tres ti- 
pos de material, ejemplo 5-4. 
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las curvas de respuesta generadas por estas tres ecuaciones de prediccion. CompArense con la grAfica de 
la interaccidn de dos factores para este experimento de la figura 5-9. 


Si varios de los factores de un experimento factorial son cuantitativos, puede usarse una superficie de 
respnesta para modelar la relacidn entre y y los factores del diseno. Ademas, los efectos de los factores 
cuantitativos pueden representarse con efectos polinomiales con un solo grado de libertad. De manera si- 
milar, es posible hacer la particidn de las interacciones de factores cuantitativos en componentes de inter- 
accion con un solo grado de libertad. Esto se ilustra en el ejemplo siguiente. 


EJEMPLO 5-5 

Se piensa que la vida efectiva de una herramienta de corte instalada en una maquina controlada numeri- 
camente se afecta por la velocidad de corte y el Angulo de la herramienta. Se seleccionan tres velocidades 
y tres angulos, y se lleva a cabo un experimento factorial con dos replicas. En la tabla 5-16 se muestran los 
datos codificados. Los numeros de las celdas encerrados en circulos son los totales de las celdas } . 

En la tabla 5-17 se presenta la salida condensada de Design-Expert para este ejemplo. Los terminos.l 
y A 1 son los efectos lineal y cuadrAtico del Angulo de la herramienta, y B y B 2 son los efectos lineal y cua- 
drAtico de la velocidad. Los tArminos AB,A 2 B,AB 2 y A 2 B 1 representan los componentes lineal x lineal, 
cuadrAtico x lineal, lineal x cuadrAtico y cuadratico x cuadratico de la interaccion de dos factores. Aun 
cuando hay algunos valores P grandes, se han conservado todos los terminos del modelo para respetar la 
jerarquia. En la ecuacion de prediccion expresada en factores codificados se utilizan los niveles -1, 0 y + 1 
deAyB para representar los niveles bajo, intermedio y alto, respectivamente, de estos factores. 

En la figura 5-19 se presenta la grAfica de contorno de la superficie generada por la ecuacion de pre- 
diccidn de la vida de la herramienta. El examen de esta superficie de respuesta indica que la vida maxima 
de la herramienta se consigue con velocidades de corte de alrededor de 150 rpm y Angulos de la herra- 
mienta de 25°. La grafica de la superficie de respuesta tridimensional de la figura 5-20 proporciona en 
esencia la misma information, pero ofrece una perspectiva diferente, y en ocasiones mAs util, de la super- 
ficie de respuesta de la vida de la herramienta. La exploracion de las superficies de respuesta es un aspec- 
to muy importante del diseno experimental, el cual se estudiarA en detalle en el capitulo 11. 


Tabla 5-16 Datos del experimento de la vida de la herramienta de corte 

Angulo de la herramienta Velocidad de corte (pulg/min) 

(grados) 125 150 175 


15 

-2 

-1 

© 

-3 

0 

© 

2 

3 

© 


20 

0 

2 

(D 

1 

3 


4 

6 


16 

25 

-1 

0 

© 

5 

6 

© 

0 

-1 

© 

9 

yi 


-2 


12 


14 

24 = 
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labia 5-17 Salida de Design-Expert para el ejemplo 5-5 


Response: Life in Hours 

ANOVA for Response Surface Reduced Order 4 Model 
Analysis of variance table [Partial sum of squares] 



Sum of 


Mean 

F 


Source 

Squares 

DF 

Square 

Value 

Prob > F 

Model 

111.00 

8 

13.87 

9.61 

0.0013 

A 

49.00 

1 

49.00 

33.92 

0.0003 

B 

16.00 

1 

16.00 

11.08 

0.0088 

A 2 

0.000 

1 

0,000 

0.000 

1.0000 

fl 2 

1.33 

1 

1.33 

0.92 

0.3618 

AB 

8.00 

1 

8.00 

5.54 

0.0431 

A 2 B 

2.67 

1 

2.67 

1.85 

0.2073 

A& 

42.67 

1 

42.67 

29.54 

0.0004 

A 2 & 

8.00 

1 

8.00 

5.54 

0.0431 

Residual 

13.00 

9 

1.44 



Lack of Fit 

0.000 

0 




Pure Error 

13.00 

9 

1.44 



Cor Total 

124.00 

17 




Std. Dev. 

1.20 

R-Squared 

0.8952 


Mean 

1.33 

Adj R-Squared 

0.8020 


C.V. 

90.14 

Pred R-Squared 

0.5806 


PRESS 

52.00 

Adeq Precision 

8.237 



significant 


Factor 

Intercept 

A-Tool Angle 

B-Speed 

A 2 

B 2 

AB 

A 2 B 

AB 2 

A 2 B 2 


Coefficient 


Standard 

96% Cl 

95 % a 

VIF 

Estimate 

DF 

Error 

Low 

High 

2.00 

1 

0.85 

0.078 

3.92 


3.50 

1 

0.60 

2.14 

4.86 

3.00 

2.00 

1 

0.60 

0.64 

3.36 

3.00 

0.000 

1 

1.04 

-2.35 

2.35 

3.00 

1.00 

1 

1.04 

-1.35 

3.35 

3.00 

-1.00 

1 

0.42 

-1.96 

-0.039 

1.00 

-1.00 

1 

0.74 

-2.66 

0.66 

3.00 

-4.00 

1 

0.74 

-5.66 

-2.34 

3.00 

-3.00 

1 

1.27 

-5.88 

-0.12 

5.00 


Final Equation in Terms of Coded Factors: 


Life 

s 


+2.00 



+3.50 

*A 


+2.00 

*B 


+0.000 

♦A 2 


+ 1.00 

*B 2 


-1.00 

♦A H 

r B 

-1.00 

♦A 2 

*B 

-4.00 

*A *B 2 

-3.00 

♦A 2 

*B 2 


Final Equation in Terms of Actual Factors: 
Life = 

-1068.00000 
+136.30000 ’Tool Angle 
+14.48000 *Speed 
-4.08000 *Too! Angle 2 
-0.049600 ’Speed 2 
-1.86400 *Tool Angle ’Speed 
+0.056000 ’Tool Angle 2 ’Speed 
+6.40000E— 003 *Tool Angle ♦Speed 2 
— 1.92000E— 004 *Tool Angle 2 ’Speed 2 



Figure 5-20 Superficie de respuesta tridimensional de la vida de la herramienta del 
ejemplo 5-5. 


I 


6 
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5-6 FORMACIONDE BLOQUES EN UN DISENO FACTORIAL 

Se han revisado los disenos factoriales en el contexto de un experimento completamente aleatorizado. En 
ocasiones no es factible o pr&ctico hacer la aleatorizacidn completa de todas las corridas de un diseno fac- 
torial. Por ejemplo, la presencia de un factor perturbador puede hacer necesario que el experimento se 
corra en bloques. Los conceptos b&sicos de la formacion de bloques se analizaron en el capitulo 4 en el 
contexto de un experimento con un solo factor. Ahora se indica la forma en que la formacidn de bloques 
puede incorporarse en un diseno factorial. Otros aspectos de la formacidn de bloques en disenos factoria- 
les se presentan en los capitulos 7, 8, 9 y 13. 

Considere un experimento factorial con dos factores (A y B) y n replicas. El modelo estadlstico lineal 
de este diseno es 

i = 1, 2, . . ., a 

y# = j“+L +/L +(r/?) s +e ijk • ;' = 1, 2,..., b (5-36) 

k = 1, 2,..., w 

donde r„ y (r/?), y representan los efectos de los factores A, B y la interaccidn AB, respectivamente. Su- 
ponga ahora que para realizar este experimento se necesita una materia prima particular. Esta materia 
prima est£ disponible en lotes cuyo tamano no es suficiente para permitir que se corran todas las abn com- 
binaciones de los tratamientos con el mismo lote. Sin embargo, si un lote contiene material suficiente 
para hacer ab observaciones, entonces un diseno altemativo es correr cada una de las n replicas utilizando 
un lote separado de materia prima. Por consiguiente, los lotes de materia prima representan una restric- 
ci6n sobre la aleatorizaci6n o un bloque, y se corre una sola replica de un experimento factorial completo 
dentro de cada bloque. El modelo de los efectos para este nuevo diseno es 

i = l,2,..., a 

yvk =/*+*, + Pj +(*£)#+<** •;' = l,2,...,b (5-37) 

k = 1, 2, ..., n 

donde d k es el efecto del bloque &-6simo. Desde luego, dentro de un bloque el orden en que se corren las 
combinaciones de los tratamientos est& completamente aleatorizado. 

En el modelo (ecuaridn 5-37) se supone que la interaccidn entre los bloques y los tratamientos es in- 
significante. Anteriormente se estableci6 el mismo supuesto en el an&lisis de disenos de bloques aleatori- 
zados. Si estas interacciones existen, no pueden separarse del componente del error. De hecho, el 
termino del error en este modelo se compone en realidad de las interacciones (td)*, (fiS) jk y (tf}d), lk . En la 
tabla 5-18 se describe el andlisis de varianza. La disposici6n tiene un gran parecido con la de un diseno 
factorial, con la suma de cuadrados del error reducida por la suma de cuadrados de los bloques. En lo que 
a los calculos se refiere, la suma de cuadrados de los bloques se encuentra como la suma de cuadrados en- 
tre los totales de los n bloques {y.jt}. 

En el ejemplo anterior, la aleatorizacion se restrmgib al interior de un lote de materia prima. En la 
practica, una diversidad de fenomenos pueden producir restricciones sobre la aleatorizaci6n, como el 
tiempo, los operadores, etc. Por ejemplo, si el experimento factorial completo no pudo correrse en un dia, 
entonces el experimentador podrfa correr una replica completa el dfa 1, una segunda replica el dia 2, etc. 
Por consiguiente, cada dia seria un bloque. 

EJEMPLO 5-6 

Un ingeniero estudia los mgtodos para mejorar la capacidad para detectar objetivos en el campo de ac- 
tion de un radar. Dos factores que el ingeniero considera importantes son la cantidad de ruido de fondo, 
o “desorden de terreno”, en el campo de accion del radar y el tipo de filtro colocado sobre la pantalla. Se 
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Tabla 5-18 An£lisis de varianza de un diseno factorial de dos factores en bloques completos aleatoraados 


Fuente de 
variacidn 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 
medio esperado 

F o 

Bloques 

His 

.1 

Hi 

n -1 

a 2 + abo\ 


A 

_L v 2 y - 2 - 

bn^f abn 

a-1 

a— 1 

MS a 

ms e 

B 

J_V yl _2l 

an^f abn 

b - 1 

b - 1 

ms b 

MS, 

AB 



° + (a-l)(b-l) 

MS^ 

MS, 

Error 

Sustraccidn 

(ab - 1 )(n - 1) 

a 2 


Ibtal 

2E2 yi 

abn - 1 




disena un experimento utilizando tres niveles del desorden de terreno y dos tipos de filtro. Estos factores 
se considerar£n fijos. El experimento se Ueva a cabo seleccionando al azar una combination de los trata- 
mientos (nivel del desorden de terreno y tipo de filtro) e introduciendo despu6s una senal que representa 
el objetivo en el campo de accidn del radar. La intensidad de este objetivo se incrementa hasta que el ope- 
rador lo observa. Entonces se mide el nivel de intensidad en el momento de la detectidn como la variable 
de respuesta. Debido a la disponibilidad de los operadores, es conveniente seleccionar un operador y 
mantenerlo en el sistema hasta que se han realizado todas las corridas necesarias, Ademds, los operado- 
res difieren en su habilidad y capacidad para operar el sistema. Por consiguiente, parece 16gico usar los 
operadores como bloques, Se seleccionan cuatro operadores al azar. Una vez que se ha elegido a un ope- 
rador, el orden en que se corren las seis combinaciones de los tratamientos se determina aleatoriamente. 
Por lo tanto, se tiene una corrida de un experimento factorial 3 x 2 en un bloque completo aleatorizado. 
Los datos se presentan en la tabla 5-19. 

El modelo lineal para este experimento es 


y ijk = fi+Vi + Pj + ( T P)ij +<5 * +E ijk 


* = 1,2,3 
7 = 1,2 
k = 1, 2, 3, 4 


donde r, representa el efecto del desorden de terreno, $ representa el efecto del tipo de filtro, (r/3) 0 es la 
interaccidn, d k es el efecto del bloque y s ijk es el componente NID(0, cr) del error. Las sumas de cuadrados 
del desorden de terreno, del tipo de filtro y de su interaction se calculan de la manera usual. La suma de 


Tabla 5-T9 Nivel de intensidad al detectarse el objetivo 


Operadores (bloques) 

Tipo de filtro 

1 


2 


3 


4 

1 

2 

1 

2 

1 

2 

1 

2 

Desorden de terreno 

Bajo 

90 

86 

96 

84 

100 

92 

92 

81 

Intermedio 

102 

87 

106 

90 

105 

97 

96 

80 

Alto 

114 

93 

112 

91 

108 

95 

98 

83 
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Tabla 5-20 Anilisis de varianza del ejemplo 5-6 


Fuente de variacibn 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

F o 

Valor P 

Desorden de terreno (G) 

335.58 

2 

167.79 

15.13 

0.0003 

Tipo de filtro (F) 

1066.67 

i 

1066.67 

96.19 

<0.0001 

GF 

77.08 

2 

38.54 

3.48 

0.0573 

Bloques 

402.17 

3 

134.06 



Error 

166.33 

15 

11.09 



Tbtal 

2047.83 

23 





cuadrados debida a los bloques se encuentra a partir de los totales de los operadores {y *} de la siguiente 
manera: 

- (3)W< 572)! +(579)I +(597)2 +(530)I (W) 

= 402.17 

En la tabla 5*20 se resume el analisis de varianza completo de este experimento. La presentation de 
la tabla 5-20 indica que todos los efectos se probaron dividiendo sus cuadrados medios por el cuadrado 
medio del error. Thnto el desorden de terreno como el tipo de filtro son significativos en el nivel de 1%, 
mientras que su interaction solo es significativa en el nivel de 10%, Por lo tanto, se concluye que tanto 
el nivel del desorden de terreno como el tipo de filtro de campo usado en la pantalla afectan la habili- 
dad del operador para detectar el objetivo, y existe cierta evidencia de una ligera interactibn entre ambos 
factores. 


En el caso de dos restricciones sobre la aleatorizacion, cada una con p niveles, si el numero de combi- 
naciones de los tratamientos en un diseno factorial de k factores es exactamente igual al numero de nive- 
les de la restriction, es decir, sip = ab ... m, entonces el diseno factorial puede correrse en un cuadrado 
latino p x p. Por ejemplo, considere una modificacibn del experimento de la detection del objetivo en el 
radar del ejemplo 5-6. Los factores de este experimento son el tipo de filtro (dos niveles) y el desorden de 
terreno (tres niveles), y los operadores se consideran como bloques. Suponga ahora que debido a limita- 
ciones de tiempo, s61o pueden hacerse seis corridas por dia. Por lo tanto, los dias se convierten en una se- 
gunda restriccibn sobre la aleatorizacion, lo cual resulta en un diseno del cuadrado latino 6x6, como 
se muestra en la tabla 5-21. En esta tabla se han usado las letras minusculas/ y g } para representar los nive- 
les z-esimo y /-bsimo del tipo de filtro y del desorden de terreno, respectivamente. Es decir, /jg 2 representa 
el filtro tipo 1 y un desorden de terreno intermedio. Observe que se necesitan ahora seis operadores, en 
lugar de los cuatro del experimento original, por lo que el numero de combinaciones de tratamientos en 
el diseno factorial 3 x 2 es exactamente igual al numero de niveles de restriccibn. Ademas, en este disefio 
cada operador se usarfa una sola vez en cada dia. Las letras latinasv4, B, C, D, E y F representan las 3 x 2 
= 6 combinaciones de tratamientos del diseno factorial como sigue:^4 =/ig 2 > C =/^ 3 ,Z) =f$ li E 

= f$iyF= /jgs- 
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Tabla 5-21 El experimento de la deteccidn del radar realizado en un cuadrado latino 6x6 





Operador 



Dfa 

1 

2 

3 

4 

5 

6 

1 

Aiftf! = 90) 

= 106) 

C(f ig3 = 108) 

D(figi = 81) 

Fifig, = 90) 

E(f2g2 = 88 ) 

2 

C(fig, = 114) 

A(f& = 96) 

= 105) 

F(f2gs = 83) 

E(f2g2 = 86 ) 

Difig i = 84) 

3 

= 102 ) 

E(fig z = 90) 

= 95) 

A(f,g, = 92) 

= 85) 

C(f lg 3 = 104) 

4 

E(f# 2 « 887) 

Dtfig! = 84) 

A(f lgl = 100) 

B(f>g2 - 96) 

C(f& = 110 ) 

Fifig, = 91) 

5 

F(f£ 3 = 93) 

C(f& = 112) 

Dtfx t = 92) 

E(f$ 2 = 80) 

A(f $ , = 90) 

B(f lg3 = 98) 

6 

D(fg , = 86 ) 

PtfzST, = 91) 

E(f*2 = 97) 

CVtf 3 = 98) 

B(f£ 2 = 100 ) 

A(f igl = 92) 


Los cinco grados de libertad entre las seis letras latinas corresponden a los efectos principales del tipo 
de filtro (un grado de libertad), el desorden de terreno (dos grados de libertad) y su interaccidn (dos gra- 
dos de libertad). El modelo estadistico lineal de este diseno es 


>w = t*+«i +*j + Pk Hrf)jk +0, +£ iild 


i = 1,2,..., 6 
1,2,3 
it = 1,2 
/= 1 , 2,...,6 


(5-38) 


donde r, y/J* son los efectos del desorden de terreno y del tipo de filtro, respectivamente, y a t y 6, represen- 
tan las restricciones sobre la aleatorizacion de los dfas y los operadores, respectivamente. Para calcular las 
sumas de cuadrados, la siguiente tabla de dos vias de los totales de los tratamientos es util: 


Desorden de terreno 

Filtro tipo 1 

Filtro tipo 2 

y.i. 

Bajo 

560 

512 

1072 

Intermedio 

607 

528 

1135 

Alto 

646 

543 

1189 

yjt 

1813 

1583 

3396 =y. 


Ademas, los totales de los renglones y las columnas son 

Renglones (y jld ): 563 568 568 568 565 564 

Columnas (y IJk ): 572 579 597 530 561 557 

En la tabla 5-22 se resume el analisis de varianza. Se ha agregado una columna a esta tabla que indica 
c6mo se determina el numero de grados de libertad de cada suma de cuadrados. 


Tabla 5-22 Analisis de varianza del experimento de la deteccidn en el radar realizado como un disefio factorial 3 x 2 en un 
cuadrado latino 


Fuente de 
variation 

Suma de 
cuadrados 

Grados de 
libertad 

Fdrmula general 
para los grados 
de libertad 

Cuadrado 

medio 

F o 

Valor P 

Desorden de terreno, G 

571.50 

2 

a-1 

285.75 

28.86 

< 0.0001 

Tipo de filtro, F 

1469.44 

1 

6-1 

1469.44 

148,43 

< 0.0001 

GF 

126.73 

2 

(a-l)(6-l) 

63.37 

6.40 

0.0071 

Dias (renglones) 

4.33 

5 

ab - 1 

0.87 



Operadores 

428.00 

5 

ab - 1 

85.60 



(columnas) 







Error 

198.00 

20 

(ab - \){ab - 2 ) 

9.90 



Ibtal 

2798.00 

36 

(ab) 2 - 1 
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5-7 PROBLEMAS 


5-1. Se cstudia el rendimiento de un proceso qufrnico. Se piensa que las dos variables m£s importantes son la pre- 
si6n y la temperatura. Se seleccionan tres niveles de cada factor y se lleva a cabo un experimento factorial con 
dos replicas. Los datos del rendimiento son: 


Tbmperatura (°C) 

Presidn (psig) 

200 

215 

230 

150 

90.4 

90.7 

90.2 


90.2 

90.6 

90.4 

160 

90.1 

90.5 

89.9 


90.3 

90.6 

90.1 

170 

90.5 

90.8 

90.4 


90.7 

90.9 

90.1 


a) Analizar los datos y sacar conclusiones. Utilizar a = 0.05. 

b) Construir las gr&ficas de los residuales apropiadas y comentar la adecuacion del modelo, 

c) 6Bajo qu6 condiciones deberfa operarse este proceso? 

5-2. Un ingeniero sospecha que el acabado superficial de una pieza met&lica se afecta por la velocidad de alimen- 
tacidn y la profundidad de corte, Selecciona tres velocidades de alimentacidn y cuatro profundidades de cor- 
te. Despu6s realiza un experimento factorial y obtiene los siguientes datos: 


Velocidad de alimentacidn 
(pulg/min) 

Profundiad de corte (pulg) 

0.15 

0.18 

0.20 

0.25 


74 

79 

82 

99 

0.20 

64 

68 

88 

104 


60 

73 

92 

96 


92 

98 

99 

104 

0.25 

86 

104 

108 

110 


88 

88 

95 

99 


99 

104 

108 

114 

0.30 

98 

99 

110 

111 


102 

95 

99 

107 


a) Analizar los datos y sacar conclusiones, Utilizar a = 0.05. 

b) Construir las grdficas de los residuales apropiadas y comentar la adecuacidn del modelo. 

c) Obtener estimaciones puntuales del acabado superficial promedio con cada velocidad de alimentacidn. 

d ) Encontrar los valores P para las pruebas del inciso a. 

5-3, Para los datos del problema 5-2, calcular la estimacidn de un intervalo de confianza de 95% de la diferencia 
media en la respuesta para velocidades de alimentacidn de 0.20 y 0.25 pulg/min. 

5-4. En un artfculo de Industrial Quality Control se describe un experimento para investigar el efecto del tipo de 
cristal y del tipo de fdsforo sobre la brillantez de un cinescopio. La variable de respuesta es la corriente (en 
microamperes) necesaria para obtener un nivel de brillantez especifico. Los datos son los siguientes: 
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Tipo de 
cristal 

Tipo de fdsforo 

1 

2 

3 


280 

300 

290 

1 

290 

310 

285 


285 

295 

290 


230 

260 

220 

2 

235 

240 

225 


240 

235 

230 


a ) £Existe algun indicio de que alguno de los dos factores influye en la brillantez? Utilizar a = 0.05. 

b) 6 Los dos factores interactuan? Utilizar a = 0.05. 

c) Analizar los residuales de este experimento. 

5-5. Johnson y Leone {Statistics and Experimental Design in Engineering and the Physical Sciences , John Wiley) 
describen un experimento realizado para investigar la torcedura de placas de cobre. Los dos factores estudia- 
dos fueron la temperatura y el contenido de cobre de las placas. La variable de respuesta fue una medida de 
la cantidad de torcedura. Los datos fueron los siguientes: 


Contenido de cobre (%) 


Temperatura (°C) 

40 

60 

80 

100 

50 

17,20 

16, 21 

24,22 

28, 27 

75 

12, 9 

18, 13 

17, 12 

27,31 

100 

16, 12 

18, 21 

25, 23 

30, 23 

125 

21, 17 

23, 21 

23, 22 

29,31 


a) 6Existe algun indicio de que alguno de los dos factores afecta la cantidad de torcedura? 6Hay alguna in- 
teraction entre los factores? Utilizar a = 0.05. 

b) Analizar los residuales de este experimento. 

c) Graficar la torcedura promedio con cada nivel del contenido de cobre y compararlas con una distribu- 
ci6n t con la escala apropiada. Describir las diferencias en los efectos de los diversos niveles del conteni- 
do de cobre sobre la torcedura. Si es deseable una torcedura baja, 6qu6 nivel del contenido de cobre 
deberfa especificarse? 

d) Suponga que no es sencillo controlar la temperatura en el medio ambiente donde van a usarse las placas 
de cobre. £Este hecho modifica la respuesta que se dio para el inciso c? 

5-6. Se estudian los factores que influyen en la resistencia a la ruptura de una fibra sintdtica. Se eligen cuatro nti- 
quinas de produccidn y tres operadores y se corre un experimento factorial utilizando fibra del mismo lote de 
produccidn. Los resultados son los siguientes: 


M£quina 

Operador 1 2 3 4 


109 

110 

108 

110 

110 

115 

109 

108 

110 

110 

111 

114 

112 

111 

109 

112 

116 

112 

114 

120 

114 

115 

119 

117 


3 
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a) Analizar los datos y sacar conclusions. Utilizar a = 0,05. 

b) Construir las grdficas de los residuales apropiadas y comentar la adecuacidn del modelo. 

5-7. Un ingeniero mec£nico estudia la fuerza de empuje desarrollada por una taladradora. Sospecha que la velo- 
cidad de taladrado y la velocidad de alimentacidn del material son los factores mds importantes. Selecciona 
cuatro velocidades de alimentacidn y usa una velocidad de taladrado alta y otra baja elegidas para represen- 
tar las condiciones de operacidn extremas. Obtiene los siguientes resultados, Analizar los datos y sacar con- 
clusiones. Utilizar a = 0.05. 


Velocidad de taladrado 

Velocidad de alimentacidn 

0.015 

0.030 

0.045 

0.060 

125 

2.70 

2.45 

2.60 

2.75 


2.78 

2.49 

2.72 

2.86 

200 

2.83 

2.85 

2.86 

2.94 


2.86 

2.80 

2,87 

2.88 


5-8. Se realiza un experimento para estudiar la influencia de la temperatura de operacidn y tres tipos de placas de 
recubrimiento de cristal, en la salida luminosa de un tubo de osciloscopio. Se registraron los siguientes datos: 


Tipo de 
cristal 

Temperatura 

100 

125 

150 


580 

1090 

1392 

1 

568 

1087 

1380 


570 

1085 

1386 


550 

1070 

1328 

2 

530 

1035 

1312 


579 

1000 

1299 


546 

1045 

867 

3 

575 

1053 

904 


599 

1066 

889 


a) Utilizar a = 0.05 en el anftlisis. 6Existe un efecto de interaccidn significativo? £E1 tipo de cristal o la tem- 
peratura afectan la respuesta? LA qu6 conclusions se llega? 

b) Ajustar un modelo apropiado que relacione la salida luminosa con el tipo de cristal y la temperatura. 

c) Analizar los residuales de este experimento, Comentar la adecuacidn de los modelos que se hayan consi- 
derado. 

5-9. Considere el experimento del problema 5-1. Ajustar un modelo apropiado a los datos de la respuesta. Usar 
este modelo como gufa para las condiciones de operacidn del proceso. 

5-10, Usar la prueba de TUkey para determinar los niveles del factor presi6n que son significativamente diferentes 
para los datos del problema 5-1. 
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5-11. Se llevd a cabo un experimento para deteraiinar si la temperatura de coccion o la posicidn en el homo afec- 
taban el espesor del endurecimiento de un dnodo de carbono. Los datos se presentan a continuaci6n: 


Posicidn 

Tbmperatura (°C) 

800 

825 

850 

* 

570 

1063 

565 

1 

565 

1080 

510 


583 

1043 

590 


528 

988 

526 

2 

547 

1026 

538 


521 

1004 

532 


Suponga que se considera que no existe ninguna interaccidn, Desarrollar el modelo estadistico. Realizar el 
andlisis de varianza y probar las hipdtesis sobre los efectos principales. 6Qud conclusiones pueden sacarse? 
Comentar la adecuacidn del modelo. 

5-12. Deducir los cuadrados medios esperados para un andlisis de varianza de dos factores con una observacidn 
por celda, suponiendo que ambos factores son fijos. 

5-13. Considere los siguientes datos de un experimento factorial de dos factores. Analizar los datos y sacar conclu- 
siones. Realizar una prueba de no aditividad, Utilizar a = 0.05. 


Factor del rengldn 

Factor de la columna 

1 

2 

3 

4 

1 

36 

39 

36 

32 

2 

18 

20 

22 

20 

3 

30 

37 

33 

34 


5-14. Se piensa que la resistencia al corte de un adhesivo se afecta por la presidn de aplicacidn y la temperatura. Se 
realiza un experimento factorial en el que ambos factores se suponen fijos. Analizar los datos y sacar conclu- 
siones. Realizar una prueba de no aditividad. 


Preston 

(lb/pulg 2 ) 

Tbmperatura (°F) 

250 

260 

270 

120 

9.60 

11.28 

9.00 

130 

9.69 

10.10 

9.57 

140 

8.43 

11.01 

9.03 

150 

9.98 

10.44 

9.80 


5-15. Considere el modelo de tres factores 


y# = t* +T i +/ ? y +Yk + ( T P)ij 


i = l,2,..., a 
j = l,Z..,b 
k = l,2,...,c 


Observe que hay una sola r£plica. Suponiendo que los tres factores son fijos, desarrollar la tabla del an^lisis 
de varianza, incluyendo los cuadrados medios esperados. £Qu£ se usaria como “error experimental” para 
probar las hipdtesis? 
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5-16. El porcentaje de la concentration de madera dura en la pulpa bruta, la presibn de la cuba y el tiempo de coc- 
ci6n de la pulpa se investigan en cuanto a sus efectos sobre la resistencia del papel, Se seleccionan tres niveles 
de la concentration de madera dura, tres niveles de la presibn y dos tiempos de coccibn, Se Ueva a cabo un ex- 
perimento factorial con dos rbplicas, obtenibndose los siguientes datos: 


Porcentaje de la 
concentracibn de 
madera dura 

Tiempo de coccibn 3.0 horas 

Tiempo de coccibn 4.0 horas 


Presibn 



Presibn 


400 

500 

650 

400 

500 

650 

2 

196.6 

197.7 

199,8 

198.4 

199.6 

200.6 


196.0 

196.0 

199.4 

198.6 

200,4 

200.9 

4 

198.5 

196.0 

198.4 

197.5 

198.7 

199,6 


197.2 

196.9 

197.6 

198.1 

198.0 

199.0 

8 

197.5 

195.6 

197.4 

197.6 

197.0 

198.5 


196.6 

196.2 

198.1 

198.4 

197.8 

199.8 


a) Analizar los datos y sacar conclusiones. Utilizar a = 0.05. 

b) Construir las grbficas de los residuales apropiadas y comentar la adecuacibn del modelo. 

c) £Bajo qub conjunto de condiciones deberfa operarse este proceso? £Por qub? 

5-17. El departamento de control de calidad de una planta de acabados textiles estudia el efecto de varios factores 
sobre el tefiido de una tela de algodbn y fibras sintbticas utilizada para fabricar camisas para caballero. Se se- 
leccionaron tres operadores, tres duraciones del ciclo y dos temperaturas, y se tineron tres ejemplares peque- 
nos de la tela bajo cada conjunto de condiciones. La tela terminada se comparb con un patrbn, y se le asignb 
una evaluacibn numbrica. Los datos se presentan enseguida. Analizar los datos y sacar conclusiones. Comen- 
tar la adecuacibn del modelo. 


Tfemperatura 


Duracibn del ciclo 


300° 



350° 



Operador 



Operador 


1 

2 

3 

1 

2 

3 


23 

27 

31 

24 

38 

34 

40 

24 

28 

32 

23 

36 

36 


25 

26 

29 

28 

35 

39 


36 

34 

33 

37 

34 

34 

50 

35 

38 

34 

39 

38 

36 


36 

39 

35 

35 

36 

31 


28 

35 

26 

26 

36 

28 

60 

24 

35 

27 

29 

37 

26 


27 

34 

25 

25 

34 

24 


5-18. Suponga que en el problema 5-1 quiere rechazarse la hipbtesis nula con una alta probabilidad si la diferencia 
entre el verdadero rendimiento promedio con dos presiones cualesquiera e$ mayor que 0.5. Si una estima- 
cibn previa razonable de la desviacibn estdndar del rendimiento es 0.1, ^cubntas rbplicas deberbn correrse? 
5-19. Se estudia el rendimiento de un proceso quimico, Los dos factores de interbs son la temperatura y la presibn. 
Se seleccionan tres niveles de cada factor; sin embargo, sblo es posible hacer nueve corridas en un dfa. El ex- 
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perimentador corre una rbplica completa en cada dia. Los datos se muestran en la tabla siguiente, Analizar 
los datos, suponiendo que los dias son bloques. 


Tfcmperatura 


Dial 

Presibn 



Dia 2 
Presibn 


250 

260 

270 

250 

260 

270 

Baja 

86.3 

84.0 

85.8 

86.1 

85.2 

87.3 

Intermedia 

88.5 

87.3 

89.0 

89.4 

89,9 

90.3 

Alta 

89.1 

90.2 

91.3 

91.7 

93.2 

93.7 


5-20. Considere los datos del problema 5-5. Analizar los datos, suponiendo que las replicas son bloques. 

5-21. Considere los datos del problema 5-6. Analizar los datos, suponiendo que las replicas son bloques. 

5-22. En un artfculo d z Journal of Testing and Evaluation (vol. 16, no. 2, pp. 508-515) se investigaron los efectos de 
la frecuencia de carga dclica y de las condiciones ambientales sobre el crecimiento de las fisuras por fatiga 
con un esfuerzo constante de 22 MPa para un material particular. Los datos del experimento se presentan 
abajo (la respuesta es el in dice de crecimiento de las fisuras por fatiga): 




Medio ambiente 

Frecuencia 

Aire 

h 2 o 

H 2 0 salada 


2.29 

2.06 

1,90 


2.47 

2.05 

1,93 

10 

2.48 

2.23 

1.75 


2.12 

2.03 

2,06 


2.65 

3.20 

3.10 


2.68 

3.18 

3.24 

1 

2.06 

3.96 

3,98 


2,38 

3.64 

3.24 


2.24 

11.00 

9,96 

0.1 

2.71 

11.00 

10.01 

2.81 

9.06 

9.36 


2.08 

11,30 

10.40 


a) Analizar los datos de este experimento (utilizar a = 0.05). 

b) Analizar los residuales. 

c) Repetir los an&lisis de los incisos a y b utilizando In (y) como la respuesta. Comentar los resultados. 

5-23. En un artfculo de IEEE Transactions on Electron Devices se describe un estudio sobre el dopado del polisili- 

cio. El experimento que se muestra a continuaeibn es una variante de dicho estudio. La variable de respuesta 
es la corriente fundamental. 


Dopado del Tfcmperatura de revenido (°C) 


polisilicio (iones) 

900 

950 

1000 

1 x 10 20 

4.60 

4.40 

10.15 

10.20 

11.01 

10.58 

2 x 10 20 

3.20 

3.50 

9.38 

10.02 

10.81 

10.60 
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a) 6Existe evidencia (con a = 0.05) que indique que el nivel de dopado del polisilicio o la tempera tura de fi- 
jacidn afecten la corriente fundamental? 

b) Construir representaciones grdficas como ayuda para interpretar este experimento. 

c) Analizar los residuales y comentar la adecuacidn del modelo. 

d ) 6E1 modelo 

y= Po $2 X 2 ~^Pl2^l^2 

est£ apoyado por este experimento = nivel de dopado, x 2 — temperatura)? Estimar los parAmetros de 
este modelo y graficar la superficie de respuesta. 



Diseno factorial 2 k 



6*1 INTRODUCCION 

Los disenos factoriales se usan ampliamente en experimentos que incluyen varios factores cuando es ne- 
cesario estudiar el efecto conjunto de los factores sobre una respuesta. En el capitulo 5 se presentaron los 
mStodos generates para el analisis de los disenos factoriales. Sin embargo, hay varios casos especiales del 
diseno factorial general que son importantes debido a su uso generalizado en el trabajo de investigacidn y 
porque constituyen las bases de otros disenos de gran valor practico. 

El mas importante de estos casos especiales es el de k factores, cada uno con s61o dos niveles. Estos 
niveles pueden ser cuantitativos, como dos valores de temperatura, presidn o tiempo, o bien cualitativos, 
como dos maquinas, dos operadores, los niveles “alto” y “bajo” de un factor, o quiz& la presencia o ausen* 
cia de un factor. Una replica completa de este diseno requiere 2 x 2x... x 2 = 2* observaciones y se le 
llama diseno factorial 2* . 

Este capitulo se enfoca en esta clase en extremo importante de disenos. A lo largo del capitulo se su- 
pone que 1) los factores son fijos, 2) los disenos son completamente aleatorizados y 3) se satisfacen los su- 
puestos de normalidad usuales. 

El diseno 2 k es de particular utilidad en las etapas iniciales del trabajo experimental, cuando proba- 
blemente se esten investigando muchos factores. Este diseno proporciona el menor numero de corridas 
con las que pueden estudiarse k factores en un diseno factorial completo. Por consiguiente, estos disenos 
se usan ampliamente en los experimentos de tamizado o seleccion de factores. 

Puesto que s61o hay dos niveles para cada factor, se supone que la respuesta es aproximadamente li- 
neal en el rango elegido para los niveles de los factores, En muchos experimentos de tamizado de facto- 
res, cuando se acaba de iniciar el estudio del proceso o sistema, este supuesto suele ser razonable, En la 
seccion 6-6 se presentara un m6todo simple para verificar este supuesto, y se analizar£n las acciones que 
deberan emprenderse en caso de que se viole. 
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6-2 EL DISENO 2 2 

El primer diseno de la serie 2* es el que sdlo tiene dos factores, por ejemplo,/4 y B; cada uno se corre a dos 
niveles. A este diseno se le llama diseno factorial 2 Z . Los niveles de los factores pueden denominarse arbi- 
trariamente “bajo” y “alto”. Como un ejemplo, considere la investigation del efecto de la concentration 
del reactivo y de la cantidad del catalizador sobre la conversion (rendimiento) de un proceso quimico. Sea 
la concentraci6n del reactivo el factor^, y sean 15 y 25 por ciento los dos niveles de interns. El catalizador 
es el factor B, con el nivel alto denotando el uso de 2 libras del catalizador y el nivel bajo denotando el uso 
de 1 libra. Se hacen tres replicas del experimento, y los datos son los siguientes: 


Factor 

A B 

Combination de 
tratamientos 

I 

Replica 

II 

ni 

Total 

~ — 

A bajo, B bajo 

28 

25 

27 

80 

+ 

A alto, B bajo 

36 

32 

32 

100 

— + 

A bajo, B alto 

18 

19 

23 

60 

+ + 

A alto, B alto 

31 

30 

29 

90 


Las combinaciones de los tratamientos se ilustran grificamente en la figura 6-1. Por convencidn, el 
efecto de un factor se denota con una letra mayuscula latina. Por lo tanto, “A” se refiere al efecto del fac- 
tor^, “B” al efecto del factors, y “AB” a la interaccidn AB. En el diseno 2 2 , los niveles bajo y alto teAyB 
se denotan por y respectivamente, en los ejesyl y B. Por lo tanto, - en el ejeyl representa el nivel 
bajo de la concentracidn (15%), mientras que + representa el nivel alto (25%), y - en el eje B representa 
el nivel bajo del catalizador, mientras que + denota el nivel alto. 

Las cuatro combinaciones de tratamientos suelen representarse con letras minusculas, como se 
muestra en la figura 6-1. Por la figura se observa que el nivel alto de cualquiera de los factores en una com- 
binacidn de tratamientos se denota por la letra minuscula correspondiente y que el nivel bajo de un factor 
en una combinaci6n de tratamientos se denota por la ausencia de la letra respectiva. Por lo tanto, a repre- 


6.60 

( 18*19 + 23 ) 
(2 libras) ^ 


2 S 

si 


Bajo _ X 
<1 libra) 


( 1 ) - 80 
(28 + 25 + 27 ) 


Bajo 

(16%) 


a* -90 
(31 + 30 -h 29) 



a * 100 
(36 + 32 + 32 ) 


H 


+ 

Alto 

(25%) 


Concentracidn 
del reactivo, 

A 

Figura 6-1 Combinaciones de los tratamientos en el di- 
sefio 2 2 . 
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senta la combinacibn de tratamientos con A en el nivel alto y B en el nivel bajo, b representa A en el nivel 
bajo y B en el nivel alto 7 y ab representa ambos factores en el nivel alto. Por convencibn, se usa (1) para de- 
notar que ambos factores est&n en el nivel bajo. Esta notacion se utiliza en todas las series 2 k , 

En un diseno factorial con dos niveles, el efecto promedio de un factor puede definirse como el cam- 
bio en la respuesta producido por un cambio en el nivel de ese factor promediado para los niveles del otro 
factor. Asimismo, los simbolos (1), a s byab representan ahora el total de las n rbplicas hechas con la com- 
binacibn de los tratamientos, como se ilustra en la figura 6-1. Ahora el efecto deA en el nivel bajo de B es 
[a - (1 )]/n y el efecto deA con el nivel alto de B es [ab - b]/n. A1 promediarse estas dos cantidades se obtie- 
ne el efecto principal de A: 

A = ~{[ab~b}+la-(l)}} 

= ^ n [ ab+a ~ b -( 1 )\ (6-1) 

El efecto principal promedio de B se encuentra a partir del efecto de B con el nivel bajo deA (es decir, 
[b - (l)]/n) y con el nivel alto de A ( o sea, [ab - a]/n) como 

B = ±{[ab-a]+[b-(l)]} 

= ^[a&+*-a-(lfl (6-2) 

El efecto de la interacci6nAB se define como la diferencia promedio entre el efecto de A con el nivel 
alto de B y el efecto de A con el nivel bajo de B. Por lo tanto, 

AB = ±{[ab-b]-[a-(l)]} 

= ±[ab+(l)-a~b] (6-3) 

De manera alternativa, AB puede definirse como la diferencia promedio entre el efecto de B con el 
nivel alto de A y el efecto de B con el nivel bajo de A. Esto llevara tambien a la ecuacibn 6-3. 

Las fbrmulas de los efectos de A, B y AB pueden deducirse con otro mbtodo. El efecto de A puede en- 
contrarse como la diferencia en la respuesta promedio de las dos combinaciones de tratamientos situadas 
a la derecha del cuadrado de la figura 6-1 (a este promedio se le llamay^+ ? porque es la respuesta prome- 
dio con las combinaciones de tratamientos donde A esta en el nivel alto) y las dos combinaciones de trata- 
mientos situadas a la izquierda del cuadrado de la figura 6-1 (o y A ~). Es decir, 

_ ab+a ft+( 1) 

2 n 2 n 

= ^[ab+a-b-(l)] 

Se trata exactamente del mismo resultado que el de la ecuacidn 6-1. El efecto d eB, ecuacion 6-2, se 
encuentra como la diferencia entre el promedio de las dos combinaciones de tratamientos de la parte su- 
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perior del cuadrado (y B + ) y el promedio de las dos combinaciones de tratamientos de la parte inferior 

for), O 

B = y*-y r 

_ab+b a+(l) 

2 n 2 n 

= ±[ab+b-a-( 1)] 

Por ultimo, el efecto de la interaction AB es el promedio de las combinaciones de tratamientos de la dia- 
gonal de derecha a izquierda del cuadrado [ab y (1)] menos el promedio de las combinaciones de trata- 
mientos de la diagonal de izquierda a derecha (a y b), o 

. «£>+(l) a+b 

AB = - v — — 

In 2n 


resultado que es identico a la ecuacibn 6-3. 

Utilizando el experimento de la figura 6-1, los efectos promedio pueden estimarse como 


1 

2(3) 


(90+100- 60- 80) =8.33 


B = — (90 + 60- 100 - 80) = -5.00 
2(3) v 

AB = ^(90+80—100—60) = 1.67 


El efecto de^l (concentracidn del reactivo) es positivo; esto sugiere que al incremental A del nivel bajo 
(15%) al nivel alto (25%), el rendimiento se incrementarl El efecto de B (catalizador) es negativo; esto 
sugiere que al incremental la cantidad del catalizador que se agrega al proceso se reducir£ el rendimien- 
to. El efecto de la interaccidn parece ser pequeno en comparacidn con los dos efectos principals. 

En muchos experimentos que incluyen disenos 2*, se examinara la magnitud y la direccidn de los efec- 
tos de los factores a fin de determinar las variables que son de posible importancia. En la mayoria de los 
casos puede usarse el an£lisis de varianza para confirmar esta interpretacidn. Hay varios paquetes de soft- 
ware de estadistica excelentes que son utiles para establecer y analizar disenos 2 k . Se cuenta tambidn con 
mdtodos especiales que ahorran tiempo cuando los c&lculos se hacen manualmente. 

Considere las sumas de cuadrados dcA, B y AB. Observe, por la ecuacidn 6-1, que se usd un contraste 
para estimar A, a saber 

Contraste^ = ab+a-b-( 1) (6-4) 

A este contraste suele llamarsele el efecto total de A A partir de las ecuaciones 6-2 y 6-3, se observa que 
tambidn se usan contrastes para estimar B yAB, Adem&s, estos tres contrastes son ortogonales. La suma 
de cuadrados de cualquier contraste puede calcularse con la ecuacion 3-29, la cual establece que la suma 
de cuadrados del contraste es igual al cuadrado del contraste dividido por el numero de observaciones en 
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cada total del contraste multiplicado por la suma de cuadrados de los coeficientes del contraste. Por con- 
siguiente, se tienen 


_[«*+<2-h-(l)] 2 

A An 

(6-5) 

[ab+b-a-{ l)] 2 

B An 

(6-6) 

_[ab+(l)-a-bf 

AB An 

(6-7) 


como las sumas de cuadrados de A, By AB. 

A1 utilizar el experimento de la figura 6-1, las sumas de cuadrados de las ecuaciones 6-5, 6-6 y 6-7 pue- 
den encontrarse como 

208 33 

“*= t |F 75 - 00 (S ' 8) 


y 


ss 


(io)l 

4(3) 


8.33 


La suma de cuadrados total se encuentra como de costumbre, es decir, 


^ i n 


1=1 j -1 k -1 


(6-9) 


En general, SS r tiene An - 1 grados de libertad. La suma de cuadrados del error, con 4(n - 1) grados de li- 
bertad, suele calcularse por sustracci6n como 


SS E — SS T — SS A — SS B — ss^ 


Para el experimento de la figura 6-1, se obtiene 

2 2 3 


<=1 1=1 k=l 

= 9398.00- 9075.00 = 323.00 


( 6 - 10 ) 


ss E = ss T ~ ss A - ss B - ss^ 

= 323.00- 208.33- 75.00 - 8.33 
= 31.34 


al utilizar SS A , SS H y SS AIl de la ecuaci6n 6-8. En la tabla 6-1 se resume el analisis de varianza completo. 
Con base en los valoresP, se concluye que los efectos principales son estadisticamente significativos y que 
no hay interaccidn entre estos factores. Esto confirma la interpretacibn de los datos que se hizo original- 
mente con base en las magnitudes de los efectos de los factores. 

Con frecuencia resulta conveniente escribir las combinaciones de los tratamientos en el orden (1), a, 



labia 6-1 An31isis de varianza del experimento de la flgura 6- 1 
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Fuente de 

Suma de 

Grados de 

Cuadrado 



variacidn 

cuadrados 

libertad 

medio 

^0 

Valor P 

A 

208.33 

1 

208.33 

53.15 

0.0001 

B 

75.00 

1 

75.00 

19.13 

0.0024 

AB 

8.33 

1 

8.33 

2.13 

0.1826 

Error 

31.34 

8 

3.92 



Tbtal 

323.00 

11 




6, ab , Se hace referenda a esto como el orden est&ndar (u orden de Yates, por el Dr. Frank Yates). A1 

utilizar este orden estAndar, se observa que los coeficientes de los contrastes usados para estimar los 


efectos son 







Efectos 

(i) 

a 

b 

ab 


A: 

-1 

+ 1 

-1 

+ 1 

B: 

-1 

-1 

+ 1 

+ 1 

AB: 

+ 1 

-1 

-1 

+ 1 


Observe que los coeficientes de los contrastes para estimar el efecto de la interaccibn son s61o el producto 
de los coeficientes correspondientes de los dos efectos principales. El coeficiente de un contraste es siem- 
pre + 1 o -1, y puede usarse una tabla de signos positivos y negatlvos como la tabla 6-2 para determinar el 
signo correcto para cada combination de tratamientos. Los encabezados de las columnas de la tabla 6-2 
son los efectos principales (A y B), la interaccibn AB e /, que representa el total o promedio del experi- 
mento completo. Observe que la columna que corresponde a I incluye unicamente signos positivos. Las 
etiquetas de los renglones son las combinaciones de los tratamientos. Para encontrar el contraste para es- 
timar cualquier efecto, simplemente se multiplican los signos de la columna apropiada de la tabla por la 
combinad6n de tratamientos correspondiente y se hace la suma. Por ejemplo, para estimar A, el contras- 
te es -(1) + a - b + ab, que concuerda con la ecuacibn 6-1. 


El modelo de regresi6n 

En un diseno factorial 2 k es sencillo expresar los resultados del experimento en terminos de un modelo de 
regresidn. Puesto que 2 k es tan sblo un diseno factorial, podrla usarse un modelo de los efectos o de las 
medias, pero el enfoque del modelo de regresibn es mucho mds natural e intuitivo. Para el experimento 
del proceso quimico de la figura 6-1, el modelo de regresibn es 

y=P O+M + 02*2 + « 

dondex, es una variable codificada que representa la concentracibn del reactivo yx 2 es una variable codi- 
ficada que representa la cantidad del catalizador y las/? son los coeficientes de regresibn. La relacibn en- 


Tabla 6-2 Signos algebraicos para calcular los 
efectos en el disefio 2 2 


Combinaci6n de Efecto factorial 

tratamientos / A B AB 


(i) 

a 

b 

ab 


+ - - + 

+ + 

+ - + 

+ + + + 
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tre las variables naturales — la concentraci6n del reactivo y la cantidad de catalizador- — y las variables 
codificadas es 

Concentracidn - (Concentracion baja +Concentrad6n 1 „ 11 ) / 2 
1 (Concentracion Mta - Concentracion baja ) / 2 


y 


Catalizador- (Catalizador bajo +Catalizador ata) ) / 2 
(Catalizador^ - Catalizador bajo )/ 2 


Cuando las variables naturales s61o tienen dos niveles, esta codificacion producira la familiar nota- 

ci6n ± 1 para los niveles de las variables codificadas. Para ilustrar esto en el ejemplo tratado, observe que 

_ Concentracion - (15+ 25) / 2 

* 1_ (25- 15)/ 2 

_ Concentracion — 20 
_ - 


Por lo tanto, si la concentracion esta en el nivel alto (Concentracidn = 25%), entonces*! - +1; si la con- 
centracidn est£ en el nivel bajo (Concentracion = 15%), entonces x x = -1* Adem&s, 

Catalizador - (1 + 2) / 2 
* 2 “ ( 2 — 1 ) / 2 

_ Catalizador- 1.5 
"" 05 


Por lo tanto, si el catalizador esta en el nivel alto (Catalizador = 2 libras), entonces x 2 - +1; si el cataliza- 
dor est& en el nivel bajo (Catalizador = 1 libra), entonces x 2 = -1. 

El modelo de regresidn ajustado es 


j>=27.5+ 




x 2 


donde la ordenada al origen es el gran promedio de las 12 observaciones, y los coeficientes de regresidn 
y P 2 son la mitad de las estimaciones de los efectos de los factores correspondientes. La razdn de que el 

coeficiente de regresion sea la mitad de la estimacidn del efecto es que un coeficiente de regresion mide el 
efecto de un cambio unitario en x sobre la media dey, y la estimation del efecto se basa en un cambio de 
dos unidades (de -1 a +1), Se demostrara m£s adelante que este mOtodo simple para estimar los coefi- 
cientes de regresion consiste en producir las estimaciones de mmimos cuadrados de los parametros* Ver 
tambien el material suplementario de este capitulo. 


Residuales y adecuacibn del modelo 

El modelo de regresidn puede usarse para obtener el valor predicho o ajustado dey en los cuatro puntos 
del diseno, Los residuales son las diferencias entre el valor observado y el valor ajustado dey. Por ejem- 
plo, cuando la concentracion del reactivo est& en el nivel bajo (x x = -1) y el catalizador est& en el nivel bajo 
(x 2 — -1), el rendimiento predicho es 


= 25.835 
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Hay tres observaciones en esta combination de tratamientos, y los residuales son 

e 1 = 28- 25.835= 2.165 
e 2 = 25- 25.835 =-0.835 
e 3 = 27-25.835=1.165 


Los valores predichos y los residuales restantes se calculan de manera similar. Para el nivel alto de la con 
centracion del reactivo y el nivel bajo del catalizador, 


y= 27.5+ 
= 34.165 


8.33^ (+1)+ /-5.00 


(- 1 ) 


e 4 = 36- 34.165= 1.835 
e 5 =32- 34.165= -2.165 
e 6 = 32- 34.165= -2.165 

Para el nivel bajo de la concentration del reactivo y el nivel alto del catalizador, 


y= 27.5+ 




(+ 1 ) 


= 20.835 


y 

e 7 =18- 20.835 = -2.835 
e s = 19— 20.835= —1.835 
e g = 23- 20.835 = 2165 

Por ultimo, para el nivel alto de ambos factores, 

,= 27.5 + (f)( + ., + (af»)( + ,) 
= 29.165 


e 10 = 31-29.165=1.835 
e u = 30 - 29.165 = 0.835 
e a = 29 - 29.165= -0.165 


En la figura 6-2 se presenta una grlfica de probabilidad normal de estos residuales y una gr&fica de los re- 
siduales contra el rendimiento predicho. Estas graficas parecen ser satisfactorias, por lo que no hay raz6n 
para sospechar problemas con la validez de las conclusiones. 


La superficie de respuesta 
El modelo de regresidn 


y= 27.5+ 
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Residual 


a) Grdflca de probabilldad normal 



Rendimiento predicho 


b) Reslduales contra el rendlmiento predicho 

Figura 6-2 Graficas de los residuales para el experimento del proce- 
so quimico, 

puede usarse para generar graficas de superficie de respuesta. Si se desea construir estas grfificas en terminos 
de los niveles de los factores naturales, entonces simplemente las relaciones entre las variables naturales y las 
codificadas que se dieion anteriormente se sustituyen en el modelo de regresirin, de donde se obtiene 

. ( 8.33V Concentracidn - 20 \ /'-5.00VCatalizador-1.5'\ 

27 ' 5+ (— I 5 ) + (— I 51 ) 

= 18.33+ 0.8333Concentraci6n- 5.00Catalizador 

En la figura 6-3 a se presenta la gr&fica de superficie de respuesta tridimensional del rendimiento de 
este modelo, y la figura 6-36 es la grafica de contomo. Puesto que el modelo es de primer orden (es decir, 
contiene unicamente los efectos principales), la superficie de respuesta ajustada es un piano. A1 examinar 
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a) Superficie de respuesta 


2.000 

1.833 

S 1.667 
■o 

1 

| 1,500 
■D 
<0 
;g 

| 1.333 
1.167 

1.000 

16.00 16.67 18.33 20.00 21.67 23.33 25.00 

Concentraci6n del reactivo 

b) Grdfica de contorno 

Figura 6-3 Gr&fica de la superficie de respuesta y gr^fica de contorno del 
experimento del proceso quimico. 

la gr£fica de contorno se observa que el rendimiento aumenta cuando la concentracidn del reactivo se in- 
crementa y la cantidad de catalizador disminuye. Frecuentemente se usa una superficie ajustada como 
6sta para encontrar la direction del mejoramiento potencial de un proceso. Una manera formal de hacer 
esto, llamada metodo del ascenso m£s pronunciado, se presentara en el capitulo 11 cuando se estudien los 
metodos para realizar la exploracidn sistematica de las superficies de respuesta. 
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6-3 EL DISENO V 


Suponga que tres factores, ^4, ByC, cada uno con dos niveles, son de interns. A1 diseno se le llama diseno 
factorial 2 3 , y en este caso la representacidn geometrica de las ocho combinaciones de tratamientos puede 
hacerse con un cubo, como se muestra en la figura 6-4 a . Utilizando la notation “ + ” y para representar 
los niveles alto y bajo de los factores, las ocho corridas del diseno 2 3 pueden enlistarse como en la figura 
6-46. Se le conoce en ocasiones como la matriz del diseno. Haciendo una ampliation de la notacion de las 
etiquetas revisada en la seccidn 6-2, las combinaciones de los tratamientos en el orden est&ndar se escri- 
ben como (1), a, b, ab, c, ac, be y abc. Recuerde que estos simbolos representan tambi£n el total de las n 
observaciones hechas con esa combination de tratamientos particular. 

Existen en realidad tres notaciones diferentes para las corridas del diseno 2 3 que son de uso general. 
La primera es la notacion + y-, llamada con frecuencia notacion geometrica. La segunda es el uso de las 
etiquetas en letras minusculas para identificar las combinaciones de los tratamientos. La terceray ultima 
notacidn utiliza 1 y 0 para denotar los niveles alto y bajo, respectivamente, de los factores, en lugar de 
+ y Estas diferentes notaciones se ilustran enseguida para el diseno 2 3 : 


Corrida 

A 

B 

C 

Etiquetas 

A 

B 

c 

1 

— 

- 

- 

a) 

0 

0 

0 

2 

+ 

- 

- 

a 

1 

0 

0 

3 

_ 

+ 

- 

b 

0 

1 

0 

4 

+ 

+ 

- 

ab 

1 

1 

0 

5 

— 

- 

+ 

c 

0 

0 

1 

6 

+ 

_ 

+ 

ac 

1 

0 

1 

7 

- 

+ 

+ 

be 

0 

1 

1 

8 

+ 

+ 

+ 

abc 

1 

1 

1 


Hay siete grados de libertad entre las ocho combinaciones de tratamientos del diseno 2 3 . Ties grados 
de libertad se asocian con los efectos principals deA,By C. Cuatro grados de libertad se asocian con las 
interacciones; uno con cada una de las interacciones AB, AC y BC y uno con la interaction ABC. 

Considere la estimaci6n de los efectos principales. Primero, considere la estimation del efecto princi- 
pal^. El efecto de^4 cuando ByC est&n en el nivel bajo es [a - (!)]/«. De manera similar, el efecto de A 



+ 

Bajo Alto 

Factor A 


Corrida 

A 

Factor 

B 

C 

1 

2 

+ 

- 

- 

3 

- 


- 

4 

+ 

+ 

- 

5 

- 


+ 

6 

+ 

- 

+ 

7 

- 

+ 

+ 

8 


+ 

+■ 


a) Vista geometries 

Figura 6-4 El diseno factorial 2 3 . 


6) La matriz del diseno 
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cuando B est& en el nivel alto y C esta en el nivel bajo es [ab -b]/n. El efecto deA cuando C esta en el nivel 
alto y B esta en el nivel bajo es [ac-c]ln. Por ultimo, el efecto deA cuando tanto B como C estan en el ni- 
vel alto es [abc -bc]/n. Por lo tanto, el efecto promedio de^4 es solo el promedio de estos cuatro efectos, o 

A = -^-[a-(l)+ab-b+ac-c+abc-bc] (6-11) 

Esta ecuacibn tambien puede desarrollarse como un contraste entre las cuatro combinaciones de tra- 
tamientos de la cara derecha del cubo de la figura 6-5 a (donde/1 esta en el nivel alto) y las cuatro de la 
cara izquierda (donde^4 esta en el nivel bajo). Es decir, el efecto de^4 es sblo el promedio de las cuatro co- 
rridas donde^l est£ en el nivel alto (y A +) menos el promedio de las cuatro corridas bonded esta en el nivel 
bajo (y A ~), o 

A ~y*-yjr 

_ a+ab+ac+abc (1 )+fe + c + fec 
4 n 4 n 


Esta ecuacion puede reescribirse como 

A — -^-[a+ab + ac+ abc — (l)-b- c— be] 


que es id6ntica a la ecuacidn 6-11. 



A b c 

a) Efectos principles 



AB AC BC 

6) InteracdOn de dos factores 



• = corridas + 
O ~ corridas - 


ABC 

c) Interaccidn de los tres factores 

Figura 6-5 Representaci6n geom6trica de los contrastes que corresponden a 
los efectos principales y las interacciones del diseno 2 3 . 
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De raanera similar, el efecto de B es la diferencia en los promedios entre las cuatro combinaciones de 
tratamientos de la cara frontal del cubo y las cuatro de la cara posterior. Se obtiene asi 

1 

= — [b+ab+bc+abc-(l)- a — c- ac] (6-12) 

El efecto de C es la diferencia en los promedios entre las cuatro combinaciones de tratamientos de la cara 
superior del cubo y las cuatro de la cara inferior, es decir, 

c= y c *~yc- 

= 2-[c+ac+bc+abc-(l)-a-b-ab] (6-13) 

Los efectos de la interaccidn de dos factores pueden calcularse con facilidad. Una medida de la in- 
teraccidnAB es la diferencia entre los efectos promedio de A con los dos niveles de B , Por convention, a la 
mitad de esta diferencia se le llama la interaccidn AB, Utilizando simbolos, 


B 

Alto (+) 
Bajo (-) 
Diferencia 


Efecto promedio de^l 

[(abc -bc)+ ( ab ~b)] 

2 n 

{(gc-c)+ [a -(!)]} 

2 n 

[abc —bc + ab —b — ac + c —a+(l)] 
2 n 


Puesto que la interaccidn AB es la mitad de esta diferencia, 

AB = [a^-^+^-6-«c+^-«+(l)] (6 _ U) 

4 n ^ 

La ecuacidn 6-14 puede escribirse de la siguiente manera: 

_ abc+ab+c+(l) bc+b+ac+a 
_ — 4n 

En esta forma, resulta facil ver que la interaccion^U es la diferencia en los promedios entre las corridas 
de dos pianos diagonales del cubo de la figura 6-5 b. Utilizando un razonamiento logico similar y con refe- 
renda a la figura 6-5 b, las interacciones AC y BC son 

AC = —-[(!)— a+b-ab-c+ac— bc+ubc] (6-15) 


y 


BC = -[(l)+a-b- ab- c- ac+bc+abc] 
An 


(6-16) 
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La interaccidn ABC se define como la diferencia promedio entre la interaccidn AB para los dos dife- 
rentes niveles de C. Por lo tanto. 


ABC = ^ { [abc - be] - [ac - c] - [ab - ft ] + [a - (1 )] } 
= ^[abc-bc:-a c + c ~ a b+b+a-(l)] 


(6-17) 


Como antes, la interaccionABC puede considerarse como la diferencia de dos promedios. Si se aislan las 
corridas de los dos promedios, estas definen los vertices de los dos tetraedros que componen el cubo de la 
figura 6-5c. 

En las ecuaciones 6-11 a 6-17, las cantidades entre corchetes son contrastes de las combinaciones de 
los tratamientos. Es posible desarrollar una tabla de signos positivos y negativos a partir de los contrastes, 
la cual se muestra en la tabla 6-3. Los signos de los efectos principales se determinan asociando un signo 
positivo con el nivel alto y un signo negativo con el nivel bajo. Una vez que se han establecido los signos de 
los efectos principales, los signos de las columnas restantes pueden obtenerse multiplicando las col umn as 
precedentes apropiadas, rengldn por renglon. Por ejemplo, los signos de la columnar son el producto 
de los signos de la columnar y la columnar en cada renglon. El contraste de cualquier efecto puede ob- 
tenerse facilmente con esta tabla. 

La tabla 6-3 tiene varias propiedades interesantes: 1) Con exception de la columna/, cada una de las 
columnas tienen el mismo numero de signos positivos y negativos. 2) La suma de los productos de los sig- 
nos de dos columnas cualesquiera es cero. 3) La columna 1 multiplicada por cualquiera de las columnas 
deja la columna sin cambio. Es decir, I es un elemento identidad. 4) El producto de dos columnas cuales- 
quiera produce una columna de la tabla. Por ejemplo, A x B = AB, y 

ABxB= AB 1 = A 

Se observa que los exponentes de los productos se forman utilizando la aritmStica modulo 2, (Es decir, el 
exponente s61o puede ser 0 o 1; si es mayor que 1, se reduce con multiplos de 2 hasta que es 0 o 1.) Todas 
estas propiedades se derivan de la ortogonalidad de los contrastes usados para estimar los efectos. 

Las sumas de cuadrados de los efectos se calculan con facilidad, ya que cada efecto tiene un contraste 
correspondiente con un solo grado de libertad. En el diseno 2 3 con n replicas, la suma de cuadrados de 
cualquier efecto es 


cc _ (Contraste) 2 

OJ — 


(6-18) 


Tabla 6-3 Signos algebraicos para calcular los efectos del disefto 2 3 


Combination de 
tratamientos 




Efecto factorial 

I 

A 

B 

AB 

C 

(i) 

+ 

- 

— 

+ 

_ 

a 

+ 

+ 

- 

— 

_ 

b 

+ 

- 

+ 

_ 

_ 

ab 

+ 

+ 

+ 

+ 

_ 

c 

+ 

- 

- 

+ 

+ 

ac 

+ 

+ 

- 

- 

+ 

be 

+ 

- 

+ 

_ 

+ 

abc 

+ 

+ 

+ 

+ 

+ 


AC 

+ 

+ 

+ 

+ 


BC ABC 

+ — 

+ + 

+ 

+ 

+ 

+ + 
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EJEMPLO 6-1 

Recuerde el ejemplo 5-3, donde se presentd un estudio del efecto del porcentaje de carbonatacion, la pre- 
sion de operation y la velocidad de linea sobre la altura de llenado de una bebida carbonatada. Suponga 
que solo se usan dos niveles de carbonatacion, de tal modo que el experimento es un diseno factorial 2 3 
con dos replicas. Los datos (es decir, las desviaciones de la altura de llenado de especificacion) se mues- 
tran en la tabla 6-4, y en la figura 6-6 se presenta la representacidn geometrica del diseno. 

A1 utilizar los totales bajo las combinaciones de los tratamientos que se muestran en la tabla 6-4, los 
efectos de los factores pueden estimarse de la siguiente manera: 

A = — \a-(l)+ab-b+ac-c+abc-bc] 

4 n 

= | [1 “ (-4)+ 5- (- 1)+ 3- (— l)+ll-2] 

= |[24]=300 
1 

B = — \b+ab+bc+abc-(l)- a-c—ac] 

An 


= ±[-l+5+2+ll-(-4)-l-(-l)-3] 
= ±[18]=2.25 

C = 2- [c + ac + be + abc - (1 ) - a - b - ab] 

= |[-l+3+2+ll-(-4)-l-(-l)-5] 

= ±[14]= 1.75 
1 

AB = — \ab-a-b+(l)+abc-bc-ac+c] 
An 


= ±[5- l-(-l)+(-4)+ll~ 2- 3+(-l)] 
= ±[6] = 0.75 


Tabla 6A El experimento de la altura de llenado, ejemplo 6-1 


Corrida 


Factores codificados 

Desviacidn de la 
altura de llenado 

Niveles del factor 

A 

B 

C 

R6plica 1 

Rdplica 2 

Bajo (-1) 

Alto (+1) 

1 

-1 

-1 

-X 

-3 

-1 

A (psi) 10 

12 

2 

1 

-1 

-1 

0 

1 

B (psi) 25 

30 

3 

-1 

1 

-1 


0 

C (b/min) 200 

250 

4 

1 

1 

-1 

2 

3 



5 

-1 

-1 

1 

-1 

0 



6 

1 

-1 

1 

2 

1 



7 

-1 

1 

1 

1 

1 



8 

1 

1 

1 

6 

5 
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be -2 abc =11 



Figura 6-6 El diseno 2 3 para el experimento de la desviaddn de 
la altura de llenado del ejemplo 6-1. 


AC= — Ul)-a+b-ab-c+ac-bc+abc] 
An 

= 4[— 4— 1+(— 1)— 5— (— 1)+3— 2+11] 
8 

= \ [2] =0.25 

BC — ^-[(1 )+a-b— ab- c- ac + bc + abc] 
= |[“4+l-(-l)-5-(-l)- 3+2+11] 
= |[4]= 0.50 


y 


ABC= -j-[abc-bc-ac+c-ab+b+a-(l)] 
An 

= i[ll-2-3+(-l)-5+(-l)+l-(-4)] 
= |[4]=0.50 


Los efectos mas grandes son para la carbonatacibn ( A = 3.00), la presibn (B = 2.25) ? la velocidad (C = 
1.75) y la interaccibn carbonatacibn-presibn (AB = 0.75), si bien el efecto de la interaction no parece te- 
ner un impacto tan grande sobre la desviacibn de la altura de llenado como los efectos principales. 
Las sumas de cuadrados se calculan con la ecuacibn 6-18 de la siguiente manera: 

SS A = = 36.00 

A 16 

SS B = ^6 -= 2025 

SS C =^- = 12.25 
16 
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Tabla 6-5 Resumen de la estimaci6n de los efectos del ejemplo 6-1 


Factor 

Estimaci6n 
del efecto 

Sumas de 
cuadrados 

Contribucion 

porcentual 

A 

3.00 

36.00 

46.1538 

B 

2.25 

20.25 

25.9615 

c 

1.75 

12.25 

15.7051 

AB 

0.75 

2.25 

2.88462 

AC 

0.25 

0.25 

0.320513 

BC 

0.50 

1.00 

1.28205 

ABC 

0.50 

L00 

1.28205 

Error puro 


5.00 

6.41026 

Total 


78.00 



SS ^=lf = 2 - 25 

^ c =^=°.25 

(4) 2 

55 * c= 16 

y 

=L0 ° 

La suma de cuadrados total es SS T ~ 78.00, y por sustraccion, SS E = 5.00. En la tabla 6-5 se resumen las 
estimaciones de los efectos y las sumas de cuadrados. La columna etiquetada “contribution porcentual” 
mide la contribucion porcentual de cada uno de los terminos del modelo a la suma de cuadrados total. La 
contribution porcentual es con frecuencia una guia aproximada pero efectiva de la importancia relativa 
de cada termino del modelo. Observe que los efectos principals dominan en realidad este proceso, expli- 
cando mas de 87% de la variabilidad total, mientras que la interaction AB explica menos de 3%. 

El aniilisrs de varianza de la tabla 6-6 puede usarse para confirmar la magnitud de estos efectos. Por la 
tabla 6-6 se observa que los efectos principales son altamente significativos (todos tienen valores P muy 


Tabla 6-6 An&lisis de varianza de los datos de la altura de llenado 


Fuente de 
variation 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

F o 

Valor P 

Porcentaje de carbonatacion (A) 

36.00 

1 

36.00 

57.60 

<0.0001 

Presidn (B) 

20.25 

1 

20.25 

32.40 

0.0005 

Velocidad de linea (C) 

12.25 

1 

12.25 

19.60 

0.0022 

AB 

2.25 

1 

2.25 

3.60 

0.0943 

AC 

0.25 

1 

0.25 

0.40 

0.5447 

BC 

1.00 

1 

1.00 

1,60 

0.2415 

ABC 

1.00 

1 

1.00 

1.60 

0.2415 

Error 

5.00 

8 

0.625 



Total 

78.00 

15 
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pequenos). La interaccidnAB es significativa con un nivel aproximado de 10%; por lo tanto, existe una li- 
gera interaccion entre la carbonatacidn y la presion. 

Quizd el lector quiera referirse al ejemplo 5-3 para la interpretacidn practica de este experimento. 
Los responsables del proceso detidieron correrlo con presion baja y velocidad de linea alta, y reducir la 
variabilidad de la carbonatacion controlando con mayor precision la temperatura. Se consiguio asi una 
reduction sustancial en la desviatidn de la altura de llenado del valor objetivo. 


El modelo de regresi6n y la superficie de respuesta 

El modelo de regresidn para predecir la desviacion de la altura de llenado es 


y— fS 0 + +fS 2 x 2 "f/^3^3 +fin x \ x i 


= 1 . 00 + 


(3.00 'l 


x i + 


2.25 


x 2 + 


(f 


X, + 


0.75 


X.X-, 


donde las variables codificadas x l9 x 2 yx 3 representan a A, B y C, respectivamente, El t6rmino x^c 2 es l a * n " 
teraccidnAB. Los residuales pueden obtenerse como la diferencia entre las desviaciones de la altura de 
llenado observaday la predicha. El an&lisis de estos residuales se deja como ejercicio para el lector. 

En la figura 6-7 se muestra la superficie de respuesta y la grafica de contomo para la desviacidn de la 
altura de llenado obtenida con el modelo de regresion, suponiendo que la velocidad de linea esta en el ni- 
vel alto (x 3 = 1). Observe que como el modelo contiene la interaccion, las lineas de contomo de la desvia- 
ci6n de las alturas de llenado constantes son curvas (o la superficie de respuesta es un piano “torcido”). 
Es deseable operar este proceso de llenado de tal modo que la desviacidn del llenado estd tan cerca de 
cero como sea posible. La grafica de contorno indica que si la velocidad de linea esta en el nivel alto, en- 
tonces hay varias combinaciones de los niveles de la carbonatacion y la presion que satisfaran este objeti- 
vo. Sin embargo, serd necesario ejercer un control preciso de estas dos variables. 


Soluci6n por computadora 

Hay muchos paquetes de software de estadistica que estableceran y analizardn disenos factoriales con dos 
niveles. La salida de uno de estos programas de computadora, Design-Expert, se muestra en la tabla 6-7. 
En la parte superior de la tabla se presenta el analisis de varianza del modelo complete. El formato de 
esta presentation es un tanto diferente de los resultados dados en la tabla 6-6. Observe que el primer ren- 
gl6n del analisis de varianza es un resumen global del modelo completo (todos los efectos principales y las 
interacciones), y la suma de cuadrados del modelo es 

ss MwW o = SS, +SS B +ss c +SS AB +SS AC +SS BC +ss^ c 
= 710 


Por lo tanto, el estadistico 


F o = 


Modelo 

ms e 


10.43 

0.63 


= 16.69 


est4 probando las hipotesis 

H 0 • Pi = P2 ~ fis = fin — fin = fin = fins ~ ^ 

H t : al menos una /S* 0 
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4.875 


3.125 


1.375 



-0.3750 h 


12.00 


25.00 10.00 V 


a) La superficie de respuesta 



Carbon atacidn 
6) La gr$fica de contorno 


Figura 6-7 Superficie de respuesta y gr£fica de contorno de la desvia- 
ci6n de la altura de llenado, con la velocidad en el nivel alto (250 bpm), 
ejemplo 6-1. 


Tabla 6-7 Salida de Design-Expert para el ejemplo 6-1 


Response: Fill Deviation In Height 

ANOVA for Selected Factorial Model 
Analysis of variance table [Partial sum of squares] 


1 " 

Sum of 


Mean 

F 


Source 

Squares 

DF 

Square 

Value 

Prob> F 

Model 

73.00 

7 

10.43 

16.69 

0.0003 

A 

36.00 

1 

36.00 

57.60 

<0.0001 

B 

20.25 

1 

20.25 

32.40 

0.0005 

c 

12.25 

1 

12.25 

19.60 

0.0022 

AB 

2.25 

1 

2.25 

3.60 

0.0943 

AC 

0.26 

1 

0.25 

0.40 

0.S447 

BC 

1.00 

1 

1.00 

1.60 

0.2415 

ABC 

1.00 

1 

1.00 

1.60 

0.2415 

Residual 

5.00 

8 

0.63 



Lack of Fit 

0.000 

0 




Pure Error 

5.00 

8 

0.63 



Cor Total 

78.00 

15 




Std. Dev. 

0.79 

R-Squared 

0.9359 


Mean 

1.00 

Adj R-Squared 

0.8798 


C.V. 

79.06 

Pred R-Squared 

0.7436 


PRESS 

20.00 

Adeq Precision 

13.416 



significant 


Factor 

Intercept 

A-Carbonation 

B-Pressure 

C-Speed 

AB 

AC 

BC 

ABC 


Coefficient 


Standard 

95% Cl 

95 % a 

VIF 

Estimate 

DF 

Error 

Low 

High 

1.00 

1 

0.20 

0.54 

1.46 


1.50 

1 

0.20 

1.04 

1.96 

1.00 

1.13 

1 

0.20 

0.67 

1.58 

1.00 

0.88 

1 

0.20 

0.42 

1.33 

1.00 

0.38 

1 

0.20 

-0.081 

0.83 

1.00 

0.13 

1 

0.20 

-0.33 

0.58 

1.00 

0.25 

1 

0.20 

-0.21 

0.71 

1.00 

0.25 

1 

0.20 

-0.21 

0.71 

1.00 


Final Equation in Terms of Coded Factors: 

Fill Deviation = 

+ 1.00 
+1.50 “A 
+1.13 *B 
+0.88 *C 
+0.38 *A *B 
+0.13 # A *C 
+0.25 *B *C 
+0.25 *A *B *C 


Final Equation in Terms of Actual Factors: 

Fill Deviation = 

-225.50000 

+21.00000 *Carbonation 
+7.80000 “Pressure 
+1.08000 “Speed 
-0.75000 “Carbonation “Pressure 
-0.10500 “Carbonation “Speed 
—0.040000 “Pressure “Speed 
+4.00000E-00: “Carbonation “Pressure “Speed 

Reduced Model: 

Response: Fill Deviation in Height 

ANOVA for Selected Factorial Model 
Analysis of variance table [Partial sum of squares] 



Tabla 6-7 ( continuacidn ) 



Sum of 


Mean 

F 




Source 

Squares 

DF 

Square 

Value 

Prob > F 



Model 

70.75 

4 

17.69 

26.84 

<0.0001 significant 



A 

36.00 

1 

36.00 

54.62 

< 0.0001 



B 

20.25 

1 

20.25 

30.72 

0.0002 



C 

12.25 

1 

12.25 

18.59 

0.0012 



AB 

2.25 

7 

2.25 

3.41 

0.0917 



Residual 

7.25 

11 

0.66 





Lack of Fit 

2.25 

3 

0.75 

1.20 

0.3700 not significant 


Pure Error 

5.00 

8 

0.63 





Cor Total 

78.00 

15 






Std. Dev. 

0.81 


R-Squared 


0.9071 



Mean 

1.00 


Adj R-Squared 

0.8733 



C.V. 

81.18 


Pred R-Squared 

0.8033 



PRESS 

15.34 


Adeq Precision 

15.424 




Coefficient 


Standard 95% Cl 95% Cl 


Factor 

Estimate 

DF 

Error Low 

High 

VIF 

Intercept 


1.00 

1 


0.20 0.55 

1.45 


A-Carbonation 


1.50 

1 


0.20 1.05 

1.95 

1,00 

B-Pressure 


1.13 

1 


0.20 0.68 

1.57. 

1.00 

C-Speed 


0.88 

1 


0.20 0.43 

1.32 

1.00 

AB 


0.38 

1 


0.20 -0.072 

0.82 

1.00 


Final Equation in Terms of Coded Factors: 

Fill Deviation = 

+ 1.00 
+ 1.50 *A 
+ 1.13 *B 
+0.88 *C 
+0.38 *A *B 

Final Equation in Terms of Actual Factors: 

Fill Deviation = 

+9.62500 

-2.62500 *Carbonation 
*“1.20000 ^Pressure 
+0.035000 *Speed 
+0.15000 *Carbonation ^Pressure 


Diagnostics Case Statistics 


Standard 

Actual 

Predicted 



Student 

Cook's 

Outlier 

Order 

Value 

Value 

Residual 

Leverage 

Residual 

Distance 

t 

1 

-3.00 

-2.13 

-0.88 

0.313 

-1.300 

0.154 

-T347 

2 

-1.00 

—2.13 

1.13 

0.313 

1.671 

0.254 

T845 

3 

0.000 

0.12 

-0.12 

0.313 

-0.186 

0.003 

—0.177 

4 

1.00 

0.12 

0.88 

0.313 

1.300 

0.154 

1.347 

5 

—TOO 

-0.63 

-0.38 

0.313 

-0.557 

0.028 

-0.539 

6 

0.000 

-0.63 

0.63 

0.313 

0.928 

0.078 

0.922 

7 

2.00 

3.13 

-1.13 

0.313 

-1.671 

0.254 

— 1 .845 

8 

3.00 

3.13 

-0.13 

0.313 

-0.186 

0.003 

-0.177 

9 

-1.00 

-0.37 

-0.63 

0.313 

-0.928 

0.078 

-0.922 

10 

0.000 

-0.37 

0.37 

0.313 

0.557 

0.028 

0,539 

11 

2.00 

T88 

0.13 

0.313 

0.186 

0,003 

0.177 

12 

TOO 

1.88 

-0.88 

0.313 

-1.300 

0.154 

-1.347 

13 

TOO 

T13 

-0.13 

0.313 

-0.186 

0,003 

-0.177 

14 

TOO 

T13 

-0.13 

0.313 

-0.186 

0.003 

-0.177 

15 

6.00 

4.88 

1.13 

0.313 

1.671 

0.254 

1.845 

16 

5.00 

4.88 

0.13 

0.313 

0.186 

0.003 

0.177 
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Puesto que F 0 es grande, se concluiria que al menos una de las variables tiene un efecto diferente de cero. 
Entonces se prueba la significacidn de cada efecto factorial individual utilizando el estadistico F. Estos re- 
sultados concuerdan con la tabla 6-6. 

Abajo del an&lisis de varianza del modelo completo se presentan varios estadisticos R 2 . La R 2 ordina- 
ria es 


R 2 


SS ^'° = = 0.9359 

SS Taui 78.00 


y mide la proporcidn de la variabilidad total explicada por el modelo. Un problema potencial con este es- 
tadistico es que siempre se incrementa cuando se agregan factores al modelo, incluso cuando estos facto- 
res no son significativos. El estadistico R 2 ajustada, definido como 


R 2 

^Ajustada 


_ss £ i^_ 

Si,,., /<;/,», 78.00/15 


es un estadistico que est& ajustado para el “tamano” del modelo; es decir, para el numero de factores. La 
R 2 ajustada puede decrecer en realidad si se agregan t^rminos no significativos al modelo, El estadistico 
PRESS es una medida de que tan bien predecir£ datos nuevos el modelo (PRESS es en realidad el acrdni- 
mo de Prediction Error Sum of Squares — suma de cuadrados del error de prediccidn — ■, y se calcula a partir 
de los errores de prediccidn obtenidos al predecir el punto ?-6simo de los datos con un modelo que incluye 
todas las observaciones, excepto la *-6sima). Un modelo con un valor pequeno de PRESS indica que es po- 
sible que el modelo sea un buen predictor. El estadistico “R 2 de prediccidn” se calcula como 


R 1 

XV Predicci6n 


PRESS 

‘^TotuI 


20.00 

78.00 


= 0.7436 


Esto indica que se esperaria que el modelo completo explique cerca de 74% de la variabilidad de los datos 
nuevos. 

La siguiente seccion de la salida presenta el coeficiente de regresion de cada termini) del modelo y el 
error estdndar (se, standard error) de cada coeficiente, definido como 




0.625 

2 ( 8 ) 


= 0.20 


Los intervalos de confianza de 95% para cada coeficiente de regresidn se calculan a partir de 

P~ t 0 .02s,N- p se(P) ^P^ P+t o.o2s, N - p se(P) 


donde los grados de libertad de t es el numero de grados de libertad del error; es decir, N es el numero to- 
tal de corridas en el experimento (16), yp es el numero de par£metros del modelo (8). Tkmbi6n se presen- 
ta el modelo completo en terminos de las variables codificadas y de las variables naturales, 

En la ultima secci6n de la tabla 6-7 se ilustra la salida despues de eliminar los t6rminos de las interac- 
ciones no significativas. Este modelo reducido contiene ahora s61o los efectos principals ^4, B y C, y la 
interaccidn AS. La suma de cuadrados de los residuales o del error se compone ahora de un componen- 
ts del error puro ("Pure Error 75 ) que surge de las replicas de los ocho v6rtices del cubo, y un componen- 
te de falta de ajuste ("Lack of Fit”), compuesto por las sumas de cuadrados de las interacciones que se 
eliminaron del modelo ( BC , AC y ABC). De nueva cuenta, la representacidn del modelo de regresidn 
de los resultados experimentales se presenta en terminos de las variables codificadas y las variables na- 
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turales. La proportion de la variabilidad total de la desviacion de la altura del llenado que se explica por 
este modelo es 


R 2 


Modelo 

^Tottl 


70.75 

78.00 


= 0.9071 


que es menor que lai? 2 del modelo completo. Observe, sin embargo, que \a.R 2 ajustada del modelo reduci- 
do apenas ha cambiado ligeramente respecto de la R 2 ajustada del modelo completo, y PRESS del mode- 
lo reducido es considerablemente menor, lo cual produce un valor mas grande de Rp rediH , i6n del modelo 
reducido. Evidentemente, la elimination de los terminos no significativos del modelo completo ha produ- 
cido un modelo final que posiblemente funcionarA con mayor eficiencia como predictor de datos nuevos. 
Observe que los intervalos de confianza para los coeficientes de regresion del modelo reducido son lige- 
ramente mas cortos que los intervalos de confianza correspondientes en el modelo completo. 

En la ultima section de la salida se presentan los residuales del modelo reducido. Design-Expert tarn- 
bien constraint todas las grdficas de los residuales que se estudiaron anteriormente. 


Otros metodos para evaluar la signification de los efectos 

El an&lisis de varianza es una manera formal de determinar curies son los efectos de los factores que son 
diferentes de cero. Existen varios metodos mas que son utiles. A continuation se indica como calcular el 
error est&ndar de los efectos y c6mo usar los errores estandar para construir intervalos de confianza para 
los efectos. Otro mdtodo, que se ilustrara en la section 6-5, utiliza grdficas de probabilidad normal para 
valorar la importancia de los efectos. 

Es sencillo encontrar el error estandar de un efecto. Si se supone que hay n replicas en cada una de las 
2 k corridas del diseno, y si y ;i , y i2 , ..., y in son las observations de la corrida i-esima, entonces 

es una estimation de la varianza de la corrida i-6sima. Las estimaciones de la varianza del diseno 2 k pue- 
den combinarse para dar una estimation de la varianza global: 

52 = 2*(n-l) ( ^ _ y ‘ )2 (649) 


Esta es tambidn la estimation de la varianza dada por el cuadrado medio del error en el andlisis de varian- 
za. La varianza de la estimation de cada efecto es 


x xr /Contrasted 
F(Efe«o).V'(— 




Cada contraste es una combination lineal de los 2 k totales de los tratamientos, y cada total consta de n ob- 
servaciones. Por lo tanto, 

F(Contraste) = n2 k o 2 
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y la varianza de un efecto es 

F ( Efect 0)= (^7” 2 * a2 



2 a 


yfn2* 

El error estOndar estimado se encontraria sacando la ralz cuadrada de esta ultima expresi6n y sustituyen- 
do o 2 con su estimation 5 2 : 

se(Efecto) = -y== (6-20) 

Observe que el error est&ndar de un efecto es el doble del error estOndar de un coeficiente de regre- 
si6n estimado en el modelo de regresidn del diseno 2 k (ver la salida de computadora de Design-Expert del 
ejemplo 6-1). 

Los intervalos de confianza de 100(1 -a) por ciento para los efectos se calculan a partir de Efecto ± 
tan, jvVe(Efecto), donde los grados de libertad de t son solo los grados de libertad de los residuales o del 
error (N-p = numero total de corridas - numero de parametros del modelo). 

Para ilustrar este metodo, considere el experimento de la desviacion de la altura de llenado del ejem- 
plo 6-1. El cuadrado medio del error es MS E = 0.625. Por lo tanto, el error estandar de cada efecto es (uti- 
lizando S 2 = MS E ) 

2S 

se( Efecto) = -^== 

2V0625 

= 0.40 

Entonces, f 0025i8 = 2.31 y W, ^(Efecto) = 2.31(0.40) = 0.92, de donde los intervalos de confianza de 
95% aproximados para los efectos de los factores son 

A: 300±0.92 
B: 225+0.92 
C: 1.75 ±0.92 
AB: 0.75 ±0.92 
AC: 0.25±0.92 
BC: 0.50+0.92 
ABC: 0.50+0.92 

Este andlisis indica qutA, ByC son factores importantes, porque son las unicas estimaciones de los efec- 
tos de los factores para las que los intervalos de confianza de 95% aproximados no incluyen al cero. 


Efectos de dispersidn 

El ingeniero de proceso que trabajd en el caso del llenado tambien se interesd en los efectos de disper- 
sion; es decir, i-alguno de los factores afecta la variabilidad de la desviaciOn de la altura de llenado de una 
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R ~ 0 R =1 



Figura 6-8 Rangos de la desviacidn de la altura de llenado del 
ejemplo 6-1. 


corrida a otra? Una manera de responder esta pregunta es examinando el rango de las desviaciones de la 
altura de llenado para cada una de las ocho corridas del diseno 2 3 . Estos rangos se grafican en el cubo de la 
figura 6-8. Observe que los rangos son aproximadamente iguales para las ocho corridas del diseno. For 
consiguiente, no hay evidencia sdlida que indique que alguna de las variables del proceso afecte directa- 
mente la variabilidad de la desviacion de la altura de llenado en el proceso. 


6*4 EL DISENO GENERAL 2 k 

Los metodos de andlisis que se han presentado hasta este punto pueden generalizarse para el caso de un 
diseno factorial 2*, es decir, un diseno con k factores que tienen dos niveles cada uno. El modelo estadisti- 
co para un diseno 2 k incluiria k efectos principals, ( * ) interacciones de dos factores, ( * ) interacciones de 
tres factores, y una interaccidn de k factores, Es decir, para un diseno 2 k el modelo completo conten- 
drfa 2* - 1 efectos. Thmbi6n se usa aqui la notation introducida anteriormente para las combinaciones de 
los tratamientos. Por ejemplo, en un diseno 2 5 , abd denota la combination de tratamientos con los facto- 
res A, B y D en el nivel alto y los factores C y E en el nivel bajo. Las combinaciones de los tratamientos 
pueden escribirse en orden estdndar introduciendo los factores uno a la vez y combinando sucesivamente 
cada nuevo factor con los que lo preceden. Por ejemplo, el orden est&ndar de un diseno 2 4 es (1), a, b } ab » 
c, ac, be, abc, d, ad, bd, abd, cd, acd ' bed y abed. 

El enfoque general para el an&lisis estadistico del diseno 2 k se resume en la tabla 6-8. Como se sehalo 
anteriormente, suele emplearse un paquete de software de computadora en este proceso de analisis. 

A estas alturas, la secuencia de pasos de la tabla 6-8 debe resultar familiar. El primer paso es estimar 
los efectos de los factores y examinar sus signos y magnitudes, De este modo el experimentador obtiene in- 

Tabla 6-8 Procedimiento de analisis 
para un disefio 2 k 

1. Estimar los efectos de los factores 

2, Formar el modelo inicial 

3, Realizar las pruebas estadfsticas 

4, Refinar el modelo 

5. Analizar los residuales 

6. Interpretar los resultados 
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formaci6n preliminar respecto de los factores y las interacciones que pueden ser importantes, y en que di- 
recdones deber&n ajustarse estos factores para mejorar la respuesta. Para formar el modelo inicial del 
experimento, por lo general $e elige el modelo complete, es decir, todos los efectos principals y las interac- 
dones, siempre que se haya hecho una replica de al menos uno de los puntos del diseno (en la seccion si- 
guiente se revisa una modification de este paso). Despues, en el paso 3 se usa el analisis de varianza para 
probar formalmente la significacidn de los efectos principales y las interacciones. En la tabla 6-9 se presenta 
la forma general de un analisis de varianza para un diseno factorial 2 k con n rdplicas. El paso 4 , refinar el 
modelo, suele consistir en la eliminad6n de las variables no significativas del modelo complete. El paso 5 es 
el analisis residual usual para verificar la adecuacion del modelo y los supuestos. En ocasiones ocurrira una 
rcfinacion del modelo despues del analisis residual, si se encuentra que el modelo es inadecuado o que hay 
violaciones serias de los supuestos. El ultimo paso consiste generalmente en el analisis grafico: graficas de 
los efectos principales o las interacdones, o superficies de respuesta y graficas de contomo. 

Aun cuando los cdlculos descritos se realizan por lo general con una computadora, en ocasiones es ne- 


cesario calcular manualmente la estimation de un efecto o la suma de cuadrados de un efecto. Para estimar 
un efecto o calcular la suma de cuadrados de un efecto, primero debe determinarse el contraste asociado 
con ese efecto. Esto puede hacerse siempre utilizando una tabla de signos positivos y negativos, como la ta- 
bla 6-2 o 6 - 3 . Sin embargo, para valores grandes de k esto resulta laborioso, y puede usarse un m6todo alter- 
native. En general, el contraste del efecto AB-K se determina expandiendo el miembro derecho de 

Contrasted ^ =(a±l)(fc±l) *-(Jt±l) ( 6 - 21 ) 

Tabla 6-9 An&lisis de varianza de un disefto 2 k 

Fuente de 

Suma de 

Grados de 

variation 

cuadrados 

libertad 

k efectos principales 



A 

SS A 

1 

B 

ss B 

1 

K 

SS K 

1 

(* ) interacciones de dos factores 



AB 

SSab 

1 

AC 

ss AC 

1 

JK 

SSjk 

1 

(3 ) interacciones de tres factores 



ABC 

SSabc 

1 

ABD 

S$ABD 

1 

IJK 

SS UK 

1 

(£ ) = 1 interaccidn de k factores 



ABC- * K 


1 

Error 

SS E 

2>-l) 

Total 

SS T 

n 2 k -1., 
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Para expandir la ecuacion 6-21 se usa el Algebra ordinaria reemplazando “1” con (1) en la expresi6n final. 
El signo de cada grupo de pardntesis es negativo si el factor esta incluido en el efecto y es positivo si el fac- 
tor no est& incluido. 

Parailustrar el uso de la ecuaci6n 6-21, considere un diseno factorial 2 3 . El contraste d tAB seria 
Contrasted =(a-l)(&-l)(c+l) 

= abc+ab+c+(l)-ac-bc-a-b 

Como un ejemplo mas, en un diseno 2 5 , el contraste de ABCD seria 

Contraste d CD = («- 1)(6- l)(c- \){d- l)(c+l) 

= abcde + cde + bde + ade + bee 
+ ace+abe+e+abcd+cd+bd 
+ ad+bc + ac+ab+(l)— a- b— c 

— abc—d — abd — acd — bed — ae 

— be—ce— abce — de— abde — aede — bade 

Una vez que se han calculado los contrastes de los efectos, pueden estimarse los efectos y calcular las 
sumas de cuadrados de acuerdo con 

2 

AB "K= — 7- (Contraste ^ K ) (6-22) 

n2 

y 

= (Contraste^ K ) (6-23) 

respectivamente, donde n denota el numero de replicas. Se cuenta tambidn con un algoritmo tabular de* 
bido al Dr. Frank Yates que en ocasiones puede ser util para el c&lculo manual de las estimaciones de los 
efectos y las sumas de cuadrados. Referirse al material suplementario del texto de este capitulo. 


6-5 UNA SOLA REPLICA DEL DISENO 2* 

Incluso para un numero moderado de factores, el numero total de combinaciones de tratamientos en un 
diseno factorial 2 k es grande. For ejemplo, un diseno 2 5 tiene 32 combinaciones de tratamientos, un dise- 
no 2 6 tiene 64 combinaciones de tratamientos, etc. Debido a que por lo general los recursos son limitados, 
el numero de replicas que el experimentador puede emplear quizes est6 restringido. Con frecuencia, los 
recursos disponibles permiten hacer unicamente una sola replica del diseno, a menos que el experimen- 
tador est6 dispuesto a omitir algunos de los factores originales. 

Un riesgo obvio cuando se realiza un experimento que tiene una sola corrida para cada combinacidn 
de prueba es que el modelo puede ajustarse al ruido. Es decir, si la respuestay es sumamente variable, 
pueden resultar conclusiones enganosas del experimento. La situation se ilustra en la figura 6-9a. En esta 
figura, la linea recta representa el verdadero efecto del factor. Sin embargo, debido a la variabilidad alea- 
toria presente en la variable de respuesta (representada por la franja sombreada), el experimentador ob- 
tiene en realidad las dos respuestas medidas representadas por los puntos negros. For consiguiente, el 
efecto del factor estimado est& cerca de cero y el experimentador ha llegado a una conclusidn errdnea res- 
pecto de este factor. Ahora bien, si hay menos variabilidad en la respuesta, la posibilidad de una conclu- 
sion errdnea ser& mds reducida. Otra forma de asegurarse de que se obtienen estimaciones confiables de 
los efectos es incrementando la distantia entre los niveles bajo (-) y alto (L) del factor, como se ilustra en 
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Factor, x 

a) Distanda pequena entre los niveles dal factor 




I I I 

- + 

Factor, x 

6) Separacidn agresiva da los niveles del factor 

Figura 6-9 El impacto de la eleccidn de los niveles del factor en un diseno 
no replicado. 


la figura 6-9 b. Observe que en esta figura la distanda incrementada entre los niveles bajo y alto del factor 
resulta en una estimacibn razonable del verdadero efecto del factor. 

El uso de la estrategia de una sola replica es coraun en los experimentos de exploracibn cuando hay 
un numero relativamente grande de factores bajo consideracibn. Debido a que en estos casos nunca pue- 
de tenerse la certeza absoluta de que el error experimental es pequeno, una buena pr&ctica en este tipo de 
experimentos es separar los niveles de los factores de manera agresiva. Quizas el lector encuentre util re- 
leer las pautas generales para elegir los niveles de los factores del capitulo 1. 

Una sola replica de un diseno 2* se denomina en ocasiones diseno factorial no replicado. Con una 
sola rbplica, no se cuenta con ninguna estimacibn interna del error (o "error puro”). Una forma de abor- 
dar este andlisis de un diseno factorial no replicado consiste en suponer que algunas interacciones de or- 
den superior son insignificantes y combinar sus cuadrados medios para estimar el error. Esto es una 
apelacibn al principio de efectos esparcidos; es decir, la mayoria de los sistemas estan dominados por al- 
gunos de los efectos principales y las interacciones de orden inferior, y la mayor parte de las interacciones 
de orden superior son insignificantes. 
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Cuando se analizan datos de disenos factoriales no replicados, ocasionalmente ocurren interacciones 
de orden superior reales. El uso de un cuadrado medio del error que se obtiene agrupando las interaccio- 
nes de orden superior no es apropiado en estos casos. Un m£todo de analisis atribuido a Daniel [35a] pro- 
porciona una forma simple de resolver este problema. Daniel sugiere examinar una grdfica de 
probabilidad normal de las estimaciones de los efectos. Los efectos que son insignificantes siguen una 
distribution normal, con media cero y varianza er 2 , y tenderan a localizarse sobre una linea recta en esta 
grafica, mientras que los efectos significativos tendr&n medias diferentes de cero y no se localizar&n sobre 
la linea recta. Por lo tanto, el modelo preliminar se especificara de tal modo que contenga aquellos efec- 
tos que aparentemente son diferentes de cero, con base en la gr&fica de probabilidad normal. Los efectos 
aparentemente insignificantes se combinan como una estimation del error. 


EJEMPLO 6-2 

Una sola replica del diseno 2 4 

Un producto quimico se fabrica en un envase presurizado. Se lleva a cabo un experimento factorial en la 
planta piloto para estudiar los factores que se piensa influyen en el indice de filtracidn de este producto. 
Los cuatro factores son la temperatura (A), la presi6n (B), la concentration del formaldehido (C) y la ve- 
locidad de agitacidn (D). Cada factor esta presente con dos niveles. La matriz del diseno y los datos de la 
respuesta obtenidos de una sola replica del experimento 2 4 se muestran en la tabla 6-10 y en la figura 6-10. 
Las 16 corridas se hacen de manera aleatoria. El ingeniero del proceso esta interesado en maximizar el in- 
dice de filtracidn. Las condiciones actuales del proceso producen indices de filtration de alrededor de 75 
gal/h. Asimismo, en el proceso actual la concentration de formaldehido, factor C, se usa en el nivel alto. 
A1 ingeniero le gustaria reducir la concentracidn de formaldehido lo mas posible, pero no ha podido ha- 
cerlo porque siempre produce indices de filtracidn m£s bajos. 

El analisis de estos datos se iniciara construyendo una grafica de probabilidad normal de las estima- 
ciones de los efectos. La formation de signos positivos y negativos para las constantes de los contrastes 


Tabla 6-10 Experimento del indice de filtracidn en la planta piloto 


Numero 
de corrida 



Factor 


Etiqueta de 
la corrida 

fndice de 
filtracidn (gal/h) 

A 

B 

C 

D 

i 

- 

- 

- 

- 

(i) 

45 

2 

+ 

- 

- 

- 

a 

71 

3 

- 

+ 

— 

- 

b 

48 

4 

+ 

+ 

- ■ 

- 

ab 

65 

- 5 : 

- 

- 

+ 

- 

c 

68 

6 

+ 

- 

+ 

- 

ac 

60 

7 ' 

_ 

+ 

+ 

- 

be 

80 

8 

+ 

+ 

+ 

- 

abc 

65 

9 

_ 

_ 

_ 

+ 

d 

43 

10 

+ 

_ 

— 

+ 

ad 

100 

11 7‘ 

- 

+ 

- 

+ 

bd 

45 

" 12 

+ 

+ 

- 

+ 

abd 

104 

13 - 

- 

- 

+ 

+ 

cd 

75 

14 - 

+ 

- 

+ 

+ 

acd 

86 s: 

15 

- 

+ 

+ 

+ 

bed 

70 

16 ’ ' 

+ 

+ 

+ 

+ 

abed 

96 { 
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Figura 6-10 Datos del experiment del indice de filtracidn en la 
planta piloto para el ejemplo 6-2. 


del diseiio 2 4 se muestra en la tabla 6-11. Apartir de estos contrastes pueden estimarse 15 efectos factoria- 
ls, y las sumas de cuadrados se presentan en la tabla 6-12. 

En la figura 6-11 se muestra la grafica de probabilidad normal de estos efectos. Tbdos los efectos que 
caen sobre la recta son insignificantes, mientras que los efectos grandes est&n apartados de ella. Los efec- 
tos importantes que surgen de este analisis son los efectos principales de A t C y D y las interacciones 
ACyAD. 

Los efectos principales de>4, C y D se grafican en la figura 6-12*z. Los tres efectos son positivos, y si 
s61o se consideraran estos efectos principales, los tres factores se correrian en el nivel alto a fin de maxi- 
mizar el indice de filtracidn. Sin embargo, siempre es necesario examinar cualquier interaction que sea 
importante. Recuerde que los efectos principales no tienen mucho significado cuando estan presentes en 
interacciones significativas. 

Las interacciones AC y AD se grafican en la figura 6-12A. Estas interacciones son la clave para resol- 
ver el problema. Observe, por la interacci6n^4C, que el efecto de la temperatura es muy pequeno cuando 
la concentracidn est& en el nivel alto y muy grande cuando la concentracidn est£ en el nivel bajo, obte- 
nidndose los mejores resultados con la concentration baja y la temperatura alta. La interaccidnAD indica 
que la velocidad de agitation/) tiene un efecto reducido con una temperatura baja, pero un efecto positi- 
vo grande con la temperatura alta. Por lo tanto, los mejores indices de filtration parecerian obtenerse 
cuando A y D estan en el nivel alto y C esta en el nivel bajo. Esto permitiria la reduccidn de la concentra- 
tion de formaldehido a un nivel m&s bajo, otro de los objetivos del experimentador. 


Proyeccidn de Un diseno 

Es posible hacer otra interpretacidn de los efectos de la figura 6-11. Puesto que B (presidn) no es signifi- 
cativa y todas las interacciones en las que interviene B son insignificantes* i? puede descartarse del experi- 
mento, de tal modo que el diseno se convierte en un factorial 2 3 en^4, CyD con dos replicas. Esto es f&cil 
de ver examinando unicamente las columnas^4, C y D en la matriz del diseno que se muestra en la tabla 
6-10 y observando que esa$ columnas forman dos r6plicas de un diseno 2 3 . En la tabla 6-13 se resume el 
analisis de varianza de los datos utilizando este supuesto de simplificacidn. Las conclusiones que se saca- 
rlan de este andlisis se maqtienen en esencia sin cambios respecto de las del ejemplo 6-2. Observe que al 
hacer la proyeccidn de la rdplica unica del diseno 2 4 en un diseno 2 3 con dos replicas, se tiene ahora tanto 
una estimacidn de la inter^cqidjiylCZ) como una estimacion del error basada en lo que en ocasiones se de- 
nomina replica oculta. : 1 





& + I I + I+ +I I + + I + I I + 


I + + + + I 1 + + I I I I+ + 


+ I + + I + I + I + I 1 + 1 + 


+ + + +IIIIIIII+ + + + 


I++I I + + I + I I++I 1 + 


Q ++! I++I I I I + + I I+ + 


§ + I + I + I + I I + I + I + I + 


Q IIIIIIII+ + + + + + + + 


I++I + I I + I+ +I + I 1 + 


& + + I I I I+ + + +I I I I+ + 


q a + i + i 1 + 1+ +1 + 1 i + i + 


U I I t I+ + + +I I I !+ + + + 


89 + i i++i i++i i++i i + 

m ^ 


05 I I I++I I++I |++| I+ + 


'C I + I + I + I + I + I + I + I + 
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Ikbla 6-12 Estimaciones de Iqs efectos de los fac tores y sumas de 


cuadrados del disefio factorial 2 4 del ejemplo 6-2 


T6rmino del 
modelo 

Estimacidn 
del efecto 

Suma de 
cuadrados 

Contribucidn 

porcentual 

A 

21.625 

1870.56 

32.6397 

B 

3.125 

39.0625 

0.681608 

C 

9.875 

390.062 

6.80626 

D 

14.625 

855.563 

14.9288 

AB 

0.125 

0.0625 

0.00109057 

AC 

-18.125 

1314.06 

22.9293 

AD 

16.625 

1105.56 

19.2911 

BC 

2.375 

22.5625 

0.393696 

BD 

-0.375 

0.5625 

0.00981515 

CD 

-1.125 

5.0625 

0.0883363 

ABC 

1.875 

14,0625 

0,245379 

ABD 

4,125 

68.0625 

1.18763 

ACD 

-1.625 

10.5625 

0.184307 

BCD 

-2.625 

27.5625 

0.480942 

ABCD 

1.375 

7.5625 

0.131959 



Figura 6-11 Gr£fica de probabilidad normal de los efectos para el diseno factorial 
2 4 del ejemplo 6-2. 
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a) Gr^ficas de los efectos principals 




b) Grtficas de las interacciones 

Figura 6-12 Gr&ficas de los efectos principals y las interacciones para el ejem- 
plo 6-2. 


Tabla 6-13 

Analisis de varianza del experimento del rndice filtracidn en la planta piloto en A, C y D 


Fuente de 
variation 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

F o 

Valor P 

A 

1870.56 

1 

1870.56 

83.36 

<0.0001 

C 

390.06 

1 

390.06 

17.38 

<0.0001 

D 

855,56 

1 

855.56 

38,13 

<0.0001 

AC 

1314.06 

1 

1314.06 

58.56 

<0.0001 

AD 

1105.56 

1 

1105.56 

49.27 

<0.0001 

CD 

5.06 

1 

5.06 

<1 


ACD 

10.56 

1 

10.56 

<1 


Error 

179.52 

8 

22.44 



Total 

5730.94 

15 
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El concepto de proyectar un diseno factorial no replicado en un diseno factorial con replicas en me- 
nos factores es muy util. En general, si se tiene una sola rdplica del diseno 2 k , y si h (h < k) factores son in- 
significantes y pueden descartarse, entonces los datos originales corresponden a un diseno factorial 
completo con dos niveles en los k - h factores restantes con 2* replicas. 


Verificacidn de diagnostico 

Deber&n aplicarse las verificaciones de diagndstico usuales a los residuales de un diseno 2 k , El andlisis 
realizado indica que los unicos efectos significativos sonA = 21.625, C = 9.875, D = 14.625, AC = -18.125 
y AD = 16.625. Si esto es correcto, los indices de filtracidn estimados estAn dados por 



donde 70.06 es la respuesta promedio y las variables codificadasrq, x 3 , jc 4 as e men valores entre -1 y + 1. El 
indice de filtracidn predicho para la corrida (1) es 

_( 1 ^ 25 )(_ i ) ( _ i ) + ( 1 ^| 25 )(_ i K _ 1 ) 

= 46.22 


Puesto que el valor observado es 45, el residual ese=y-y=45 - 46.22 = -1.22. A continuacidn se pre^ 
sentan los valores de y, yy e = y- J > para las 16 observaciones. 



y 

9 

I 

II 

(1) 

45 

46.22 

-1.22 

a 

71 

69.39 

1.61 

b 

48 

46.22 

1.78 

ab 

65 

69.39 

-4.39 

c 

68 

74.23 

-6.23 

ac 

60 

61.14 

-1.14 

be 

80 

74.23 

5,77 

abc 

65 

61.14 

3.86 

d 

43 

44.22 

-1.22 

ad 

100 

100.65 

-0.65 

bd 

45 

44.22 

0.78 

abd 

104 

100.65 

3.35 

cd 

75 

72.23 

2.77 

acd 

86 

92.40 

-6.40 

bed 

70 

72.23 

-2.23 

abed 

96 

92.40 

3.60 


En la figura 6-13 se muestra la gr^fica de probabilidad normal de los residuales. Los puntos de esta grafica 
se localizan razonablemente proximos a una linea recta, brindando apoyo a la conclusidn de que A, C, D, 
AC y AD son los unicos efectos significativos y que se satisfacen los supuestos fundamentales del analisis. 
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Residual 

Figure 6-13 Gr£fica de probabilidad normal de los residuales del ejemplo 6-2. 


La superficie de respuesta 

Las gr&ficas de las interacciones de la figura 6-12 se utilizaron para ofrecer una interpretacidn prictica de 
los resultados de este experimento. En ocasiones es util emplear la superficie de respuesta para este fin. 
La superficie de respuesta se genera por el modelo de regresidn 



En la figura 6-14a se muestra la gr&fica de contomo de la superficie de respuesta cuando la velocidad de agita- 
ci6n est& en el nivel alto (es decir, x 4 = 1). Los contomos se generan a partir del modelo anterior conx 4 = l,o 


y= 77.3725+ 


/'38.25'i ( 

— )* 1+ ( 


9.875^ 


I 


X, - 


18.125 


)*i J 


Observe que los contomos son lineas curvas porque el modelo contiene un termino de interaction. 

La figura 6-14 b es la grdfica de contomo de la superficie de respuesta cuando la temperatura esta en 
el nivel alto (es decir, x 1 = 1). Cuando se hace Xj = 1 en el modelo de regresidn se obtiene 


. (8.25\ (31.25\ 

5>-80.8725-(— )*,+(—] 
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a) Grdflca de contorno con la velocidad da agitacibn t D), jc 4 - 1 



Concent racibn, C (* 3 ) 


b) Grifica de contomo con la temperature {A), x, = 1 
Figure 6*14 Gr&ficas de contomo del indice de filtracidn, ejemplo 6-2. 

Estos contomos son rectas paraldas porque el modelo contiene unicamente los efectos principales de los 
factores C ( x 3 ) y D (* 4 ). 

Ambas grificas de contomo indican que si se quiere ma ximiz ar el indice de filtraeidn, las variables^ 
(Xj) y D (x 4 ) deber&n estar en el nivel alto y que el proceso es relativamente robusto para la concentracidn 
C. Se obtuvieron conclusiones similares a partir de las gr&ficas de las interacciones. 

La mitad de grdfica normal de los efectos 

Una altemativa para la grafica de probabilidad normal de los efectos de los factores es la mitad de grtifica 
normal. Es una gr&fica del valor absoluto de las estimaciones de los efectos contra sus probabilidades nor- 
males acumuladas. En la figura 6-15 se muestra la mitad de grifica normal de los efectos para el ejemplo 
6-2* La linea recta de la mitad de grifica normal siempre pasa por el origen y deberi pasar tambi6n cerca del 
valor de los datos del percentil cincuenta. Muchos analistas sienten que es mis ficil interpretar la mitad de 
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Efecto 

Flgura 6-15 Mitad de giifica normal de los efectos de los factores del ejemplo 6-2, 


grdfica normal, en particular si s61o se cuenta con pocas estimaciones de los efectos, como cuando el experi- 
mentador ha usado un diseno de ocho corridas. Algunos paquetes de software construir&n ambas graficas. 

Otros metodos para analizar disenos factoriales no replicados 

El procedimiento de analisis estandar para un diseno factorial de dos factores no replicado es la grafica 
normal (o mitad de grdfica normal) de los efectos estimados de los factores. Sin embargo, los disenos no 
replicados son tan usados en la pr4ctica que se han propuesto muchos procedimientos formales de an&li- 
sis para resolver la subjetividad de la gr&fica de probabilidad normal. Hamada y Balakrishnan [52] com- 
pararon algunos de estos mdtodos. Encontraron que el metodo propuesto por Lenth [70] tiene una 
potencia adecuada para detectar efectos significativos. Tambidn es facil de implementar y, como resulta- 
do, estd empezando a aparecer en algunos paquetes de software para analizar datos de disenos factoriales 
no replicados. Se ofrece una breve descripcidn del metodo de Lenth. 

Suponga que se tienen m contrastes de interns, por ejemplo c lf c 2 , ..., c m . Si el diseno cs un factorial 2 k 
no replicado, estos contrastes corresponden a las m = 2 k - 1 estimaciones de lbs efectos de los factores: La 
base del metodo de Lenth es estimar la varianza de un contraste a partir de las estimaciones mas peque- 
has (en valor absoluto) de los contrastes. Sean ; ; : . 5 

• j 0 = 1.5 x mediana (|c y |) •- 

■ .• :* ' . . . * 1.5 b< mediana V 
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PSE denota el “pseudo error estdndar”, y Lenth demuestra que es un estimador razonable de la varianza 
del contraste cuando no hay muchos efectos activos (significativos). El PSE se usa para juzgar la significa- 
tion de los contrastes. Un contraste individual puede compararse con el margen de error (ME, margin of 
error) 


ME =t 0.025, d XPSE 

donde los grados de libertad se definen como d = m/3. Para hacer inferencias sobre un grupo de contras- 
tes, Lenth sugiere usar el margen de error simultaneo ( SME , simultaneous margin of error) 

SME = t y J x PSE 

donde el punto porcentual de la distribucidn t que se usa es y = 1 - (1 + 0.95 1/m )/2. 

Para ilustrar el mdtodo de Lenth, considere el experimento 2 4 del ejemplo 6-2. Los c&lculos dan como 
resultado s 0 = 1.5 x | —2.625 1 = 3.9375 y 2.5 x 3.9375 = 9.84375, de donde 

PSE= 1.5 X |1.75|= 2625 
ME =2.511 x 2625=6.75 
SME= 5.219 x 2625= 1270 


Considere ahora las estimaciones de los efectos de la tabla 6-12. El criterio SME indicarfa que los cuatro 
efectos m&s grandes (en magnitud) son significativos, ya que las estimaciones de sus efectos exceden 
SME. El efecto principal de C es significativo de acuerdo con el criterio ME, pero no con respecto al SME. 
Sin embargo, puesto que es evidente que la interaction ^4C es importante, probablemente C se incluirfa 
en la lista de efectos significativos. Observe que en este ejemplo el mdtodo de Lenth produjo la misma 
respuesta que la obtenida anteriormente con el examen de la gr&fica de probabilidad normal de los 
efectos. 

Varios autores (ver Hamada y Balakrishnan [52], Loughin [73], Loughin y Noble [74] y Lamtz y Whit- 
comb [69]) han hecho notar que el mdtodo de Lenth falla para controlar los indices del error tipo I, y que 
pueden usarse m£todos de simulackm para calibrar su procedimiento. Lamtz y Whitcomb [69] sugieren 
reemplazar los multiplicadores ME y SME con multiplicadores qjustados de la siguiente manera: 


Numero de contrastes 

7 

15 

31 

ME original 

3764 

2.571 

2.218 

ME ajustado 

2.295 

2.140 

2.082 

SME original 

9.008 

5.219 

4.218 

SME ajustado 

4.891 

4.163 

4.030 


Estos resultados coinciden en gran medida con los de Ye y Hamada [114]. 

En general, el m6todo de Lenth es un procedimiento ingenioso y util. Sin embargo, recomendamos 
utilizarlo como complemento de la gr&fica de probabilidad normal usual de los efectos, no como su susti- 
tuto. 

Bisgaard [10] ha proporcionado una sutil t£cnica gr&fica, Hamada carta de inferencia conditional, 
como ayuda para interpretar la grafica de probabilidad normal. La finalidad de esta grafica es ayudar al 
experimentador a juzgar los efectos significativos. Esto seria relativamente sencillo si se conociera la des- 
viacidn estdndar o, o si pudiera estimarse a partir de los datos. En disenos no replicados, no se cuenta con 
ninguna estimacidn interna de a, por lo que la carta de inferencia condicional estd disehada para ayudar 
al experimentador a evaluar la magnitud de los efectos para un rango de valores de la desviacion est&ndar. 
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Bisgaard fundamenta la gr^fica en el resultado de que el error est&ndar de un efecto, en un diseno de dos 
niveles con N corridas (para un diseno factorial no replicado, N = 2 k ), es 

2a 

JN 

donde a es la desviacidn estandar de una observation individual. Entonces ±2 veces el error estindar de 
un efecto es 

± 7W 

Una vez que se estiman los efectos, se hace una gr&fica como la que se muestra en la figura 6-16, con las 
estimaciones de los efectos graficadas en el eje vertical, o ejey. En esta figura se han usado las estimacio- 
nes de los efectos del ejemplo 6-2. El eje horizontal, o x, de la figura 6-16 es la escala de la desviatiOn es- 
tandar (a). Las dos rectas estan en 

4 a 4 a 

y ~ + jN y y ~~7W 

En el ejemplo tratado aqui, N = 16, por lo que las rectas est&n eny = +oyy = -o. Por lo tanto, para cual- 
quier valor dado de la desviacidn est&ndar a, la distancia entre estas dos rectas puede leerse como un in- 
tervalo de confianza de 95% aproximado para los efectos insignificantes. 

En la figura 6-16 se obseiva que si el experimentador piensa que la desviacidn estandar estd entre 4 y 
8, entonces los factores^, C,Dy las interacciones^4C y AD son significativos. Si el experimentador piensa 
que la desviacidn estandar tiene un valor de hasta 10, el factor C quizd no sea significativo. Es decir, para 



Figura 6-16 Carta de inferencia condicional para el 
ejemplo 6-2. 
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D 

+ 




Figura 6-17 Datos del experimento de perforaddn del ejemplo 6-3 . 


cualquier supuesto dado acerca de la magnitud de a 9 el experimentador puede construir una “cinta de me- 
dir” para juzgar la significacidn aproximada de los efectos. La carta tambi^n puede usarse en sentido in- 
verso. Por ejemplo, suponga que estuviera en duda si el factor C es significative o no. Entonces el 
experimentador podrfa preguntar si es razonable esperar que a pudiera ser tan grande como 10 o m 3s. Si 
es improbable que a sea tan grande como 10, entonces puede concluirse que C es significative. 

Se presentan ahora tres ilustrativos ejeraplos de disenos factoriales 2 k no replicados. 


EJEMPLO 6*3 

Transformation de datos en un diseno factorial 

Daniel [35b] describe un diseno factorial 2* utilizado para estudiar la rapidez de avance de una perforadora 
como una funcidn de cuatro factores: la carga de la perforadora (A), la rapidez de flujo (#), la veloddad de rota- 
ci6n (C) y el tipo de lodo de perforaridn usado (D). Los datos del experimento se presentan en la figura 6-17. 

En la figura 6-18 se muestra la gr£fica de probabilidad normal de las estimaciones de los efectos de 
este experimento. Con base en esta gr&fica, los factores B, CyD, junto con las interacciones BC y BD, 
requieren interpretaci6n. La figura 6-19 es la gr£fica de probabilidad normal de los residuales y la fi- 
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- 2-10 1 2 


Residuales 

Figura 6-19 Gr&fica de probabilidad normal de los residuales del ejemplo 6-3. 

gura 6-20 es la gr&fica de los residuales contra la velocidad de avance predicha a partir del modelo que 
contiene los factores identificados. Hay problemas evidentes con la normalidad y la igualdad de la varian- 
za. Con frecuencia se usa una transformation de los datos para abordar estos problemas. Puesto que la va- 
riable de respuesta es una razdn de cambio, la transformation logaritmica parece un candidato razonable. 



Velocidad de avance predicha 


Figura 6-20 Gr&fica de los residuales contra la velocidad de avance 
predicha en el ejemplo 6-3. 
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Figura 6-21 Grdfica de probabilidad normal de los efectos del ejemplo 6-3 des- 
pu6s de la transformation logarftmica. 


En la figura 6-21 se presenta la gr&fica de probabilidad normal de las estimaciones de los efectos des- 
pu£s de hacer la transformacidn y* = lny. Observe que al parecer ahora es posible una interpretacidn 
mucho m&s simple, ya que s61o los factores B>CyD est&n activos. Es decir, expresar los datos en la m6tri- 
ca correcta ha simplificado su estructura hasta el punto de que las dos interacciones han dejado de reque- 
rirse en el modelo explicatorio. 



Figura 6-22 Grifica de probabilidad normal de los residuales del ejemplo 6-3 
despu£s de la transformacidn logaritmica. 
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Figura 6-23 Gr£fica de los residuales contra la velocidad predicha 
para el ejemplo 6-3 despu£s de la transformacidn logaritmlca. 


En las figuras 6-22 y 6-23 se presentan, respectivamente, una gr&fica de probabilidad normal de los 
residuales y una grafica de los residuales contra la rapidez de avance predicha para el modelo en la escala 
logaritmica que contiene a B, Cy D. Ahora estas gr&ficas son satisfactorias. Se concluye que el modelo 
y* = lny solo requiere los factores B, C y D para una interpretacidn adecuada. En la tabla 6-14 se resume 
el analisis de varianza de este modelo* La suma de cuadrados del modelo es 

^Modelo = SS B +SS C +SS D 

= 5.345+1*339 + 0*431 
= 7.115 

y R 2 = SS Modc JSS T = 7*115/7.288 = 0.98, por lo que el modelo explica cerca de 98% de la variabilidad de la 
rapidez de avance de la perforadora. 


EJEMPLO 6*4 

Efectos de localization y dispersion en un diseno factorial no replicado 

Se corrio un diseno 2 4 en un proceso de manufactura de paneles laterales y ventanas de un avion comer- 
cial. Los paneles se hacen en una prensa, y bajo las condiciones actuates es demasiado elevado el numero 


Tabla 6-14 An&lisis de varianza del ejemplo 6-3 despu6s de la txansformacidn logaritmica 


Fuente de 
variacidn 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

F o 

Valor P 

B (Flujo) 

5.345 

1 

5.345 

381.79 

<0.0001 

C (Velocidad) 

1*339 

1 

1.339 

95.64 

<0.0001 

D (Lodo) 

0.431 

1 

0.431 

30.79 

<0.0001 

Error 

0.173 

12 

0.014 



Tbtal 

7.288 

15 
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Factores 

Bajo (-) 

Alto (+) 

A - Temperatura (°F) 

295 

326 

B - Tiempo de sujecidn (min) 

7 

9 

C - Flujo de resina 

10 

20 

D = Tiempo de cierre (s) 

15 

30 


D 



Figure 6-24 Datos del experimento del proceso de los paneles 
del ejemplo 6-4. 


promedio de defectos por panel en una operaci6n de prensado. (El promedio actual del proceso es 5.5 de- 
fectos por panel.) Se investigan cuatro factores utilizando una sola r6plica de un diseno 2 4 , en el que cada 
r6plica corresponde a una sola operation de prensado. Los factores son la temperatura (A), el tiempo de 
sujecidn (B), el flujo de resina (C) y el tiempo de cierre en el prensado (D). En la figura 6-24 se muestran 
los datos de este experimento. 

En la figura 6-25 se muestra la gr&fica de probabilidad normal de los efectos de los factores. Es evi- 
dente que los dos efectos mSs grandes son ,4 = 5.75 y C = -4.25. Ningun efecto de los otros factores pare- 
ce ser tan grande, y Ay C explican cerca de 77% de la variabilidad total, por lo que se concluye que la 
temperatura (A) bajay el flujo de resina (C) alto reducirian la incidencia de defectos en los paneles. 

El analisis residual cuidadoso es un aspecto importante de cualquier experimento. La gr&fica de pro- 
babilidad normal de los residuales no indict) anomalias, pero cuando el experimentador graficd los resi- 



-10 -5 0 5 10 


Efectos de los factores 

Figura 6-25 Gr&fica de probabilidad normal de los efectos de los factores para 
el experimento del proceso de los paneles del ejemplo 6-4* 
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duales contra cada uno de los factores A a D, la grSfica de los residuales contra B (tiempo de sujecibn) 
presentb el patron de la figura 6-26. Este factor, que carece de importancia en lo que se refiere al numero 
promedio de defectos por panel, es muy importante en su efecto sobre la variabilidad del proceso, con el 
tiempo de sujecibn bajo dando como resultado una variabilidad menor en el numero promedio de defec- 
tos por panel en una opcracion de prensado. 

El efecto de dispersibn del tiempo de sujecibn tambibn es muy evidente en la grbfica de cubo de la fi- 
gura 6-27, donde se grafica el numero promedio de defectos por panel y el rango del numero de defectos 
en cada punto del cubo definido por los factored, ByC. El rango promedio cuando B estl en el nivel alto 
(la cara posterior del cubo de la figura 6-27) es R B + * 4.75, y cuando B esta en el nivel bajo es R B - = 1 .25 . 

Como resultado de este experimento, el ingeniero decidio operar el proceso con la temperatura baja 
y el flujo de resina alto para reducir el numero promedio de defectos, con el tiempo de sujecibn bajo para 
reducir la variabilidad en el numero de defectos por panel, y con el tiempo de cierre en el prensado bajo 
(el cual no tuvo ningun efecto ni sobre la localizaci6n ni sobre la dispersibn). El nuevo ajuste de las condi- 
ciones de operacibn produjo un nuevo promedio del proceso de menos de un defecto por panel. 


Los residuales de un diseno 2* proporcionan mucha informacibn acerca del problema bajo estudio. Pues- 
to que los residuales pueden considerarse como los valores observados del ruido o error, con frecuencia ofre- 
cen informadon acerca de la variabilidad del proceso. Puede hacerse el examen sistematico de los residuales 
de un diseno 2 k no replicado para proporcionar informacibn acerca de la variabilidad del proceso. 


« « 3.5 R - 4.5 



A <= Temperature (*F) 

Figura 6-27 Grafica de cubo de la temperatura, el tiempo de sujecidn y el flujo de 
resina para el ejemplo 6-4, 
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Considere la grdfica de los residuales de la figura 6-26. La desviacidn estdndar de los ocho residuales 
donde B est& en el nivel bajo es S(B~) - 0.83, y la desviacion estandar de los ocho residuales donde B estdi 
en el nivel alto es S(B + ) = 2.72. El estadistico 


r B U1 P 2, 


(6-24) 

S\B-) V } 

tiene una distribution aproximadamente normal cuando las dos varianzas rr(F + ) y <r(B ) son iguales. 
Para ilustrar los calculos, el valor de t" K es 


F* 

r B 


= In 


= In 


S 2 (fl*) 
S 2 (B~) 
(2. 72) 2 
(0.83) 2 


= 2.37 


En la tabla 6-15 se presenta el conjunto completo de contrastes para el diseno 2 4 junto con los resi- 
duales para cada corrida del experimento del proceso de los paneles del ejemplo 6-4. Cada columna de 
esta tabla contiene el mismo numero de signos positivos y negativos, y es posible calcular la desviacidn es- 
tdndar de los residuales de cada grupo de signos en cada columna, por ejemplo, S(i + ) yS(i ),i = 1, 2, ..., 15. 
Entonces 

17-h.f^ 1 “ 1» 2>...» 15 (6-25) 

es un estadistico que puede usarse para evaluar la magnitud de los efectos de dispersidn del experimento. 
Si la varianza de los residuales de las corridas donde el factor i es positivo es igual a la varianza de los resi- 
duales de las corridas donde el factor i es negativo, entonces F' tiene una distribucidn aproximadamente 
normal. Los valores de F’ se presentan al final de cada columna de la tabla 6-15. 

La figura 6-28 es la grdfica de probabilidad normal de los efectos de dispersidn F ' . Evidentemente, B 
es un factor importante en lo que se refiere a la dispersidn del proceso. Para un estudio mas amplio de 



§ 

T- 

X 


Figura 6-28 Gr&fica de probabilidad normal de los efectos de dispersion 
F* del ejemplo 6-4. 
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este procedimiento, ver Boxy Meyer [19] y Myers y Montgomery [85a]. Asimismo, para que los residuales 
del modelo ofrezcan la informatidn apropiada acerca de los efectos de dispersion, es necesario especifi- 
car correctamente el modelo de Qocalizacidn. Referirse al material suplementario del texto de este capitu- 
lo para mayores detalles y un ejemplo. 

EJEMPLO 6-5 * 

Mediciones duplicadas de la respuesta 

Un equipo de ingenieros en una f£brica de semiconductores realizaron un diseno factorial 2 4 en un homo 
de oxidatidn vertical. Se “apilan” cuatro obleas en el homo, y la variable de respuesta de interds es el es- 
pesor del 6xido en las obleas. Los cuatro factores del diseno son la temperatura ( A\ el tiempo (B), la pre- 
si6n (C) y el flujo de gas ( D ). El experimento se lleva a cabo cargando cuatro obleas en el homo, ajustando 
las variables del proceso en las condiciones de prueba requeridas por el diseno experimental, procesando 
las obleas y midiendo despu6s el espesor del 6xido en las cuatro obleas, En la tabla 6-16 se presentan el di- 
seno y las mediciones del espesor resultantes. En esta tabla, las cuatro columnas bajo el encabezado 
“Espesor” contienen las mediciones del espesor del oxido de cada oblea individual, y las dos ultimas co- 
lumnas contienen el promedio muestral y la varianza muestral de las mediciones del espesor en las cuatro 
obleas de cada corrida. 

La manera apropiada de analizar este experimento es considerar las mediciones del espesor de las 
obleas individuales como mediciones duplicadas, y no como replicas. Si fueran en realidad replicas, 
cada oblea se habria procesado individualmente en una sola corrida del homo. Sin embargo, debido a que 
las cuatro obleas se procesaron en conjunto, recibieron los factores de los tratamientos (es decir, los nive- 
les de las variables del diseno) simultdneamente , por lo que hay mucho menos variabilidad en las medicio- 
nes del espesor de las obleas individuales que la que se habria observado si cada oblea fuera una replica. 
Por lo tanto, el promedio de las mediciones del espesor es la variable de respuesta correcta que deber^ 
considerarse inicialmente. 

En la tabla 6-17 se muestran las estimaciones de los efectos de este experimento, utilizando el espesor 
del 6xido promedio y como la variable de respuesta. Observe que los factores^l y B y la interaction's tie- 
nen efectos grandes que explican en conjunto cerca de 90% de la variabilidad del espesor promedio del 


Tabla 6-16 El experimento del espesor del 6xido 


Orden Orden de 


est&ndar 

la corrida 

A 

B 

C 

D 

1 

10 

- 1 

-1 

-1 

-1 

2 

7 

1 

-1 

-1 

-1 

3 

3 

-1 

1 

-1 

-1 

4 

9 

1 

1 

-1 

-1 

5 

6 

-1 

-1 

1 

-1 

6 

2 

1 

-1 

1 

-1 

7 

5 

-1 

1 

1 

-1 

8 

4 

1 

1 

1 

-1 

9 

12 

-1 

-1 

-1 

1 

10 

16 

1 

-1 

-1 

1 

11 

8 

-1 

1 

-1 

1 

12 

1 

1 

1 

-1 

1 

13 

14 

-1 

-1 

1 

1 

14 

15 

1 

-1 

1 

1 

15 

11 

-1 

1 

1 

1 

16 

13 

1 

1 

1 

1 


Espesor 


378 

376 

379 

415 

416 

416 

380 

379 

382 

450 

446 

449 

375 

371 

373 

391 

390 

388 

384 

385 

386 

426 

433 

430 

381 

381 

375 

416 

420 

412 

371 

372 

371 

445 

448 

443 

377 

377 

379 

391 

391 

386 

375 

376 

376 

430 

430 

428 


y s 2 


379 

378 

2 

417 

416 

0.67 

383 

381 

3.33 

447 

448 

3.33 

369 

372 

6,67 

391 

390 

2 

385 

385 

0.67 

431 

430 

8.67 

383 

380 

12.00 

412 

415 

14.67 

370 

371 

0.67 

448 

446 

6 

379 

378 

1.33 

400 

392 

34 

377 

376 

0.67 

428 

429 

1.33 
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labia 6-17 Estimaciones de los efectos del ejemplo 6-5, la variable de 
respuesta es el espesor promedlo del 6xido 


T6rmino del 
modelo 

Estimacidn 
del efecto 

Suma de 
cuadrados 

Contribucidn 

porcentual 

A 

43.125 

7439.06 

67.9339 

B 

18.125 

1314.06 

12.0001 

C 

-10.375 

430.562 

3.93192 

D 

-1.625 

10.5625 

0.0964573 

AB 

16.875 

1139.06 

10.402 

AC 

-10.625 

451.563 

4.12369 

AD 

1.125 

5.0625 

0.046231 

BC 

3.875 

60.0625 

0.548494 

BD 

-3.875 

60.0625 

0.548494 

CD 

1.125 

5.0625 

0.046231 

ABC 

-0.375 

0.5625 

0.00513678 

ABD 

2.875 

33.0625 

0.301929 

ACD 

-0.125 

0.0625 

0.000570753 

BCD 

-0.625 

1.5625 

0.0142688 

ABCD 

0.125 

0,0625 

0.000570753 


6xido. La figura 6-29 es una grafica de probabilidad normal de los efectos. A1 examinar esta representa- 
tion, se concluiria que los factores .4, B y C y las interacciones AB y AC son importantes. En la tabla 6-18 
se muestra el analisis de varianza de este modelo. 

El modelo para predecir el espesor promedio del Oxido es 

y~ 399.19+ 21.56*! + 9.06x 2 -5.19x 3 +8.44*^ -5.31 xjX 3 

El analisis residual de este modelo es satisfactorio. 

Los experimentadores est&n interesados en obtener un espesor promedio del oxido de 400 A, y las es- 
pecificaciones del producto requieren que el espesor sea de entre 390 y 410 A. En la figura 6-30 se presen- 
tan dos graficas de contomo del espesor promedio, una con el factor C (ox 3 ), la presion, en el nivel bajo 
(es decir, x 3 = -1) y la otra con C (ox 3 ) en el nivel alto (es decir, x 3 = +1). A1 examinar estas graficas de 
contomo, es evidente que hay muchas combinaciones del tiempo y la temperatura (factores./! y B) que 
producir&n resultados aceptables. Sin embargo, si la presion se mantiene constante en el nivel bajo, la 
“ventana” de operacidn se corre hacia el extremo izquierdo, o mas bajo, del eje del tiempo, indicando que 
se necesitaran duraciones del dclo mis cortas para conseguir el espesor del Oxido deseado. 

Es interesante observar los resultados que se hubieran obtenido si las mediciones del espesor del 6xi- 
do de las obleas se hubieran considerado incorrectamente como replicas. En la tabla 6-19 se presenta el 
antdisis de varianza del modelo completo basado en tratar el experimento como un diseno factorial 2 4 con 
replicas. Observe que hay muchos factores significativos en este analisis, lo cual sugiere un modelo mucho 
mtis complejo del que se encontro cuando se utilizo el espesor promedio del 6xido como la respuesta. La 
razdn de esto es que la estimation de la varianza del error de la tabla 6-19 es muy pequena (a 2 = 6.12). El 
cuadrado medio de los residuales de la tabla 6-19 refleja la variabilidad entre las obleas dentro de una co- 
rrida y la variabilidad entre las corridas. La estimation del error que se obtiene en la tabla 6-18 es mucho 
mas grande, a 2 = 17.61, y es principalmente una medida de la variabilidad entre las corridas. Esta es la 
mejor estimation del error que debera usarse para juzgar la signification de las variables del proceso que 
se modifican de una corrida a otra. 

Una pregunta lOgica que podria plantearse es: 6 que dafio causa identificar demasiados factores como 
importantes?, como ciertamente serfa el caso en el analisis incorrecto de la tabla 6-19. La respuesta es que 
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Efocto 

Figura 6-29 Gr&fica de probabilidad normal de los efectos para la respuesta del es- 
pesor promedio del 6xido, ejemplo 6*5. 


Tabla 6-18 An&lisis de varianza (de Design-Expen) para la respuesta espesor promedio del 6xido, 
ejemplo 6-5 



Sum of 


Mean 

F 


Source 

Squares 

DF 

Square 

Value 

Prob > F 

Mode! 

10774.31 

5 

2154.86 

122.35 

<0.000 

A 

7439.06 

1 

7439.06 

422.37 

<0.000 

B 

1314.06 

1 

1314.06 

74.61 

< 0.000 

C 

430.56 

1 

430.56 

24.45 

0.0006 

AB 

1139.06 

1 

1139.06 

64.67 

< 0.000 

AC 

451.56 

1 

451.56 

25.64 

0.0005 

Residual 

176.12 

10 

17.61 



Cor Total 

10950.44 

15 




Std. Dev. 

4.20 

fl-Squared 


0.9839 


Mean 

399.19 

Adj. /^Squared 

0.9759 


C.V. 

1.05 

Pred, ^Squared 

0.9588 


PRESS 

450.88 

Adeq. Precision 

27.967 



Coefficient 


Standard 

95% Cl 

95% Cl 

Factor 

Estimate 

DP 

Error 

Low 

High 

Intercept 

399.19 

1 

1.05 

396.85 

401.53 

A-Time 

21.56 

1 

1.05 

19.22 

23.90 

8-Temp 

9.06 

1 

1.05 

6.72 

11.40 

C-Pressure 

-5.19 

1 

1.05 

-7.53 

-2.85 

AB 

8.44 

1 

1.05 

6.10 

10.78 

AC 

-5.31 

1 

1,05 

-7.65 

-2.97 
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Figura 6-30 GrAficas de contomo del espesor promedio del 6xido con 
la presi6n (x 3 ) mantenida constante. 

intentar manipular u optimizar los factores que no son importantes seria un desperdicio de recursos, y po- 
dria resultar en agregar variabilidad innecesaria a otras respuestas de interns. 

Cuando se hacen mediciones duplicadas de la respuesta, casi siempre hay information util acerca de 
algtin aspecto de la variabilidad del proceso contenida en estas observaciones. Por ejemplo, si las medi- 
ciones duplicadas son pruebas multiples hechas con un instrumento de medicidn en la misma unidad ex- 
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labia 6-19 An&lisis de varianza (de Design'Expert) de la respuesta individual del espesor del 6xido de 
las obleas 

Source 

Sum of 
Squares 

DF 

Mean 

Square 

F 

Value 

Rrob > F 

Model 

43801.75 

15 

2920.12 

476.75 

<0.0001 

A 

29756.25 

1 

29756.25 

4858.16 

<0.0001 

B 

5256.25 

1 

5256.25 

858.16 

<0.0001 

C 

1722.25 

1 

1722.25 

281. 18 

<0.0001 

D 

42.25 

1 

42.25 

6.90 

0.0115 

AB 

4556.25 

1 

4556.25 

743.88 

< 0.0001 

AC 

1806.25 

1 

1806.25 

294.90 

<0.0001 

AD 

20.25 

1 

20.25 

3.31 

0.0753 

BC 

240.25 

1 

240.25 

39.22 

<0.0001 

BD 

240.25 

1 

240.25 

39.22 

<0.0001 

CD 

20.25 

1 

20.25 

3.31 

0.0753 

ABO 

132.25 

1 

132.25 

21.59 

< 0.0001 

ABC 

2.25 

1 

2.25 

0.37 

0.5473 

ACD 

0.25 

1 

0.25 

0.041 

0.8407 

BCD 

6.25 

1 

6.25 

1.02 

0.3175 

ABCD 

0.25 

1 

0.25 

0.041 

0.8407 

Residual 

294.00 

48 

6.12 



Lack of Fit 

0.000 

0 




Pure Error 

294.00 

48 

6.13 



Cor. Total 

44095.75 

63 





perimental, entonces las mediciones duplicadas proporcionan cierta infonnaci6n acerca de la eficiencia 
del instrumento de medicidn. Si las mediciones duplicadas se hacen en diferentes lugares dentro de una 
unidad experimental, pueden brindar cierta informacidn acerca de la uniformidad de la variable de res- 
puesta en esa unidad. En el ejemplo tratado aquf, ya que se tiene una observacidn en cada una de cuatro 
unidades experimentales que se han sometido a un procesamiento conjunto, se tiene cierta informacidn 
acerca de la variabilidad dentro de las corridas del proceso. Esta informaci6n se encuentra contenida en la 
varianza de las mediciones del espesor del 6xido de las cuatro obleas de cada corrida. Seria de interns de- 
terminar si alguna de las variables del proceso influye en la variabilidad al interior de las corridas. 

La figura 6-31 es una grdfica de probabilidad normal de las estimaciones de los efectos obtenidas uti- 
lizando ln($ 2 ) como la respuesta. Recuerde que en el capitulo 3 se indic6 que la transformacidn logaritmi- 
ca es por lo general apropiada para modelar la variabilidad. No hay ningun efecto individual fuerte, pero 
el factor^ y la interaccidn BD son los m&s grandes. Si se incluyen tambi6n los efectos principales deByD 
para obtener un modelo jer£rquico, entonces el modelo de ln(s z ) es 


ln(s 2 )= 1.08+0.41^ - 0.40 x 2 + 0.20x 4 - Q.56x 2 x 4 

El modelo explica apenas poco menos de la mitad de la variabilidad en la respuesta ln(s 2 ), lo cual desde 
luego no es nada espectacular para un modelo empirico, pero con frecuencia es dificil obtener modelos 
excepcionalmente buenos de las varianzas. 

La figura 6-32 es una gr£fica de contomo de la varianza predicha (no del logaritmo de la varianza pre- 
dicha) con la presidn x 3 en el nivel bajo (recuerde que con esto se miniraiza la duracidn del ciclo) y el flujc 
de gasx 4 en el nivel alto. Esta eleccidn del flujo de gas produce los valores minimos de la varianza predicha 


en la regidn de la gr&fica de contomo. 

En este caso, los experimentadores se enfocaron en seleccionar valores de las variables de diseno que die- 
ran un espesor medio del 6xido dentro de las espedficaciones del proceso y tan cerca de 400 A como fuera po- 
sible, hadendo al mismo tiempo que la variabilidad dentro de las corridas sea pequena, por ejemplo s 2 s 
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Figura 6-31 Grdfica de probabilidad normal de los efectos utilizando In (s 2 ) como 
la respuesta, ejemplo 6-5. 



Figura 6-32 Gr^fica de contorno de s 2 (variabilidad dentro de las co- 
rridas) con la presi6n en el nivel bajo y el flujo de gas en el nlvel alto. 
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Figura 6-33 Superposici6n del espesor promedio del 6xido y las res- 
puestas s z con la presi6n en el nivel bajo y el flujo de gas en el nivel alto. 


Una manera posible de encontrar un conjunto de condiciones adecuado es superponiendo las graficas de 
contorao de las figuras 6-30 y 6-32. La grafica de la superposicidn se muestra en la figura 6-33, con las es- 
pecificaciones del espesor medio del 6xido y la restriccidn j 2 < 2 indicadas como contomos. En esta gr&fi- 
ca, la presi6n se mantiene constante en el nivel bajo y el flujo de gas se mantiene constante en el nivel alto. 
La regidn no sombreada cerca de la parte central izquierda de la gr&fica identifica una regidn factible 
para las variables tiempo y temperatura. 

Este es un ejemplo simple del uso de las gr&ficas de contorno para estudiar dos respuestas simultd- 
neamente. Este problema se analizara con mayor detalle en el capitulo 11. 


6*6 ADICldN DE PUNTOS CENTRALES EN EL DISENO 2* 

Una preocupad6n potencial en el uso de disenos factoriales de dos niveles es el supuesto de la linealidad 
de los efectos de los factores. Desde luego, no es necesaria la linealidad perfecta, y el sistema 2* funciona- 
bastante bien incluso cuando el supuesto de linealidad sea v<Uido solo de manera muy aproximada. De 
hecho, se ha senalado ya que si se agregan los t4rminos de interacci6n a un modelo de los efectos princi- 
pales o de primer orden, de donde se obtiene 

k 

^ +£ (6-26) 

y-i i<j 

entonces se tiene un modelo con la capacidad de representar cierta curvatura en la funcion de respuesta. 
Esta curvatura, desde luego, es resultado del torcimiento del piano inducido por los tdrminos de interac- 
tidnJ.pcpcj. 
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Habra situaciones en que la curvatura de la funcion de respuesta no este modelada adecuadamente 
por la ecuacidn 6-26. En tales casos, un modelo 16gico por considerar es 

y- e, +2 es , +22 ess , +2 M +« < 6 - 27 > 

}=i ><i i = i 


donde las fa representan efectos cuadrdticos o de segundo orden puros. A la ecuacidn 6-27 se le llama mo- 
delo de superficie de respuesta de segundo orden. 

Cuando se realiza un experimento factorial de dos niveles, por lo general se anticipa el ajuste del mo- 
delo de primer orden de la ecuaci6n 6-26, pero debera estarse alerta ante la posibilidad de que el modelo 
de segundo orden de la ecuacidn 6-27 sea en realidad mas apropiado. Existe un mdtodo para hacer una re- 
plica de ciertos puntos de un diseno factorial 2* que ofrecera proteccion contra la curvatura de los efectos 
de segundo orden a la vez que permitird una estimaci6n independiente del error que va a obtenerse. El 
metodo consiste en agregar puntos centrales en el diseno 2*. Estos consisten en n replicas que se corren 
en los puntos x, = 0 (i = 1, 2, ..., k). Una razdn importante para agregar rdplicas de las corridas en el cen- 
tro del diseno es que los puntos centrales no afectan las estimaciones usuales de los efectos en un diseno 
2*. Cuando se agregan puntos centrales, se supone que los k factores son cuantitativos. 

Para ilustrar este enfoque, considere un diseno 2 2 con una observaci6n en cada uno de los puntos fac- 
toriales (-, -),(+,-),(-,+) y (+,+), yn c observaciones en el punto central (0, 0). En la figura 6-34 se ilus- 
tra la situacidn. Seay F el promedio de las cuatro corridas en los cuatro puntos factoriales y seay c el 
promedio de las n c corridas en el punto central. Si la diferenciay F -y c es pequena, entonces los puntos 
centrales caen en el piano (o cerca de 61) que pasa por los puntos factoriales, y no hay curvatura cuadrdti- 
ca. Por otra parte, si y F ~y c es grande, entonces estd presente una curvatura cuadr&tica. La suma de cua- 
drados de la curvatura cuadrdtica pura con un solo grado de libertad esta dada por 


SS 


Cuadr^tica pura 


n F + n c 


(6-28) 


donde, en general, n F es el numero de puntos del diseno factorial. Esta cantidad puede compararse con el 
cuadrado medio del error para probar la curvatura cuadratica pura. Mas especificamente, cuando se 


y 



Figura 6-34 Diseno 2 2 con puntos centrales. 
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agregan puntos en el centra del diseno 2 k , con la prueba de la curvatura (utilizando la ecuacidn 6-28) en 
realidad se prueban las hipdtesis 

Pjj — 0 
i-1 

/= i 

Ademas, si los puntos factoriales del diseno no tienen replicas, pueden usarse los n c puntos centrales para 
construir una estimacion del error con n c ~ 1 grados de libertad. 


EJEMPLO 6-6 


Un ingeniero quimico estudia el rendimiento de un proceso. Hay dos variables de interds, el tiempo de 
reaccidn y la temperatura de reaccidn. Debido a que no se tiene la seguridad sobre el supuesto de lineali- 
dad en la regidn de exploracidn, el ingeniero decide realizar un diseno factorial 2 2 (con una sola replica de 
cada corrida factorial) aumentando con cinco puntos centrales. El diseno y los datos del rendimiento 
se muestran en la figura 6-35. 

En la tabla 6-20 se resume el analisis de varianza de este experimento. El cuadrado medio del error se 
calcula a partir de los puntos centrales de la siguiente manera: 


MS e = 



2 (*-» ! 
Puntos centrales 

n c ~ 1 


(6-29) 


Por lo tanto, por la tabla 6-20, 



0.1720 

4 


= 0.0430 



40.0 41.5 



I 1 I 

-1 0 +1 


I 1 I 

30 35 40 


A a Tiempo de reaction {min) 


Figura 6-35 El disefio 2 2 con cinco puntos 
centrales para el ejemplo 6-6, 
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Tabla 6-20 An^Lisis de varianza del ejemplo 6-6 


Fuente de 
variation 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

F 0 

Valor P 

A (Hempo) 

2.4025 

1 

2.4025 

55.87 

0.0017 

B (Temperatura) 

0.4225 

1 

0.4225 

9.83 

0.0350 

AB 

0.0025 

1 

0.0025 

0.06 

0.8185 

Cuadratica pura 

0.0027 

1 

0.0027 

0.06 

0.8185 

Error 

0.1720 

4 

0.0430 



Total 

3.0022 

8 





El promedio de los puntos de la parte factorial del diseno es y F = 40.425, y el promedio de los puntos si- 
tuados en el centra esy c = 40.46. La diferenciay f -y c = 40.425 - 40.46 = -0.035 parece ser pequefia. La 
suma de cuadrados de la curvatura cuadrfitica pura de la tabla del analisis de varianza se calcula con la 
ecuacibn 6-28 de la siguiente manera: 


SS, 


Cuadratica pura 


( y f y c ) 

n F +n c 

_ (4)(5)(— 0.035) 2 
4+5 
= 0.0027 


El analisis de varianza indica que ambos factores tienen efectos principales significativos, que no existe 
interaccibn, y que no hay evidencia de curvatura de segundo orden en la respuesta en la regibn de explora- 
cibn. Es decir, la hipbtesis nula H 0 : + P 22 = 0 no puede rechazarse. 


En el ejemplo 6-6 se llegb a la conclusion de que no habia indicios de efectos cuadr&ticos; es decir, un 
modelo de primer orden 

y— fto 4 " (%2 X 2 + Pl2 X l X 2 4 "® 

es apropiado (aun cuando probablemente no se necesite el termino de la interaccibn). Habr& situaciones 
en las que se necesitaran los tbrminos cuadraticos. Es decir, se tendra que suponer entonces un modelo de 
segundo orden tal como 

y= ji 0 + /} jjq + fi jATj + Pi 2 X i X 2 + 4~ ft 22 X 2 4" £ 

Desafortunadamente, los par^metros desconocidos (las fi) de este modelo no pueden estimarse, ya que 
hay seis parametros por estimar y el diseno 2 2 mas los puntos centrales de la figura 6-35 sblo tienen cinco 
corridas independientes. 

Una soluci6n simple y de gran efectividad de este problema es aumentar el diseno 2 2 con cuatro corri- 
das axiales, como se ilustra en la figura 6-36a. El diseno resultante, Uamado diseno central compuesto, 
puede usarse entonces para ajustar el modelo de segundo orden. En la figura 6-36 b se muestra un diseno 
central compuesto para it = 3 factores. Este diseno tiene 14 + n c corridas (generalmente 3 5), y es 

un disefio muy efiriente para ajustar el modelo de segundo orden con 10 parametros enk = 3 factores. 

Los disefios compuestos centrales se usan ampliamente para construir modelos de superficie de res- 
puesta de segundo orden. Estos disefios se estudiarfin con mayor detalle en el capitulo 11. 
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o) Dos factores &) Tres factores 

Figura 6-36 Disenos centrales compuestos. 


Se concluye esta section con algunas sugerencias y observaciones adicionales utiles referentes al uso 
de puntos centrales. 

1. Cuando un experimento factorial se lleva a cabo en un proceso en marcha, considere utilizar las 
condiciones de operacion actuales (o de receta) como el punto central del diseno. Esto con fre- 
cuencia le asegura al personal de operacion que al menos una parte de las corridas del experimento 
van a realizarse bajo condiciones familiares, y por lo tanto es improbable que los resultados obteni- 
dos (por lo menos para estas corridas) sean peores que los que se obtienen tipicamente. 

2. Cuando el punto central de un experimento factorial corresponde con las condiciones de opera- 
ci6n actuales, el experimentador puede usar las respuestas observadas en el punto central para 
proporcionar una verification aproximada de si algo “inusual” ocurrio durante el experimento. 
Es dedr, las respuestas del punto central deberan ser muy similares a las respuestas observadas 
historicamente en la operacion rutinaria del proceso. Con frecuencia el personal de operacidn 
llevara una carta de control para monitorear el desempeno del proceso. En ocasiones las res- 
puestas de los puntos centrales pueden graficarse directamente en la carta de control como una 
verification de la forma en que estuvo operando el proceso durante el experimento. 

3. Considere correr las replicas del punto central en orden no aleatorio. Especfficamente, deber&n 
correrse uno o dos puntos centrales en o cerca del principio del experimento, uno o dos cerca de 
la parte media, y uno o dos cerca del final. Al separar los puntos centrales en el tiempo, el experi- 
mentador tiene una verificacidn aproximada de la estabilidad del proceso durante el experimen- 
to. Por ejemplo, si ha ocurrido una tendencia en la respuesta mientras se realizaba el 
experimento, graficar las respuestas de los puntos centrales contra el tiempo puede poner de ma- 
nifiesto esta situation. 

4. En ocasiones los experimentos tienen que realizarse en situaciones en las que la information pre- 
via acerca de la variabilidad del proceso es escasa o nula. En estos casos, correr dos o tres puntos 
centrales como las primeras corridas en el experimento puede ser de suma utilidad. Estas corridas 
pueden proporcionar una estimation preliminar de la variabilidad. Si la magnitud de la variabili- 
dad parece razonable, se continua; por otra parte, si la variabilidad observada es mayor que la anti- 
cipada (io que la razonable!), habrd que detenerse. Con frecuencia es muy provechoso estudiar la 
cuestidn de por qu6 es tan grande la variabilidad antes de proceder con el resto del experimento. 

5. Generalmente, se utilizan puntos centrales cuando todos los factores del diseno son cuantitati- 
vos. Sin embargo, en ocasiones habr& una o mas variables cualitativas o categoricas y varias cuan- 
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Figura 6-37 Un diseno 2 3 con un factor cualitativo y puntos 
centrales. 


titativas. Sigue siendo posible emplear los puntos centrales en estos casos. Para ilustrar este 
punto, considere un experimento con dos factores cuantitativos, el tiempo y la temperatura, cada 
uno con dos niveles, y un solo factor cualitativo, el tipo de catalizador, tambi6n con dos niveles 
(org&nico e inorg&nico). En la figura 6-37 se muestra el diseno 2 3 para estos factores. Observe 
que los puntos centrales se colocan en las caras opuestas del cubo que incluyen los factores cuan- 
titativos. En otras palabras, los puntos centrales pueden correrse con las combinaciones de los 
tratamientos en los niveles alto y bajo de los factores cualitativos, siempre y cuando esos subespa- 
cios incluyan unicamente factores cuantitativos. 

6-7 PROBLEMAS 

6-1. Un ingeniero estd interesado en los efectos de la velocidad de corte (A), la geometrfa de la herramienta (i?) y 
el Angulo de corte (C) sobre la vida (en horas) de una mdquina herramienta. Se eligen dos niveles de cada 
factor y se corren tres rdplicas de un diseno factorial 2 3 . Los resultados fueron los siguientes: 


A 

B 

C 

Combinacidn de 
tratamientos 

I 

R6plica 

II 

III 

_ 

— 


(i) 

22 

31 

25 

+ 

- 

- 

a 

32 

43 

29 

- 

+ 

- 

b 

35 

34 

50 

+ 

+ 

- 

ab 

55 

47 

46 

- 

- 

+ 

c 

44 

45 

38 

+ 

- 

+ 

ac 

40 

37 

36 

- 

+ 

+ 

be 

60 

50 

54 

-1- 

+. 

+ 

abc 

39 

41 

47 


a) Estimar los efectos de los factores. lQu€ efectos parecen ser grandes? 

b ) Usar el an£lisis de varianza para confirmar las conclusiones del inciso a . 

c ) Escribir un modelo de regresidn para predecir la vida de la herramienta (en horas) con base en los resul- 
tados de este experimento. 

d) Analizar los residuales. £Hay algun problema evidente? 

e) Con base en el an£lisis de las grdficas de los efectos principales y las interactions, ccudles serian los ni- 
veles de Ay B y C que se recomendarfa utilizar? 

6-2. Considere nuevamente el inciso c del problema 6-1. Utilizar el modelo de regresidn para generar las grdficas 
de la superficie de respuestay de contorno de la respuesta, la vida de la herramienta. Interpretar estas grdfi- 
cas. 60frecen alguna idea respecto de las condiciones de operacidn deseables para este proceso? 
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6-3* Encontrar el error estindar de los efectos de los faetores y aproximar los limites de confianza de 95 % para los 
efectos de los faetores en el problema 6-1. Lhos resultados de este an£lisis concuerdan con las conclusiones 
del an&lisis de varianza? 

6-4. Representar los efectos de los faetores del problema 6- 1 en una grlfica relativa a una distribucidn t escalada 
apropiadamente. LEn esta representation grlfica se identifican de manera adecuada los faetores importan- 
tes? Comparar las conclusiones de esta gr&fica con los resultados del an&lisis de varianza. 

6-5. Se usa una miquina para hacer ranuras de localizacidn en una tarjeta de circuitos impresos. El nivel de vibra- 
ci6n en la superficie de la tarjeta cuando se hacen las ranuras se considera una fuente principal de variacidn 
dimensional de las ranuras. Se piensa que dos faetores influyen en la vibracidn: el tamaiio de las ranuras (A) y 
la velocidad de corte ( B ). Se seleccionan dos tamanos de las ranuras y j de pulgada) y dos velocidades (40 y 
90 rpm), y se hacen ranuras en cuatro tarjetas con cada conjunto de condiciones que se muestran abajo. La 
variable de respuesta es la vibracidn medida como el vector resultante de tres acelerdmetros (x,y yz) en cada 
tarjeta de prueba. 


A 

B 

Combinacidn de 
tratamientos 

I 

Replica 

n iii 

IV 

_ 

_ 

(i) 

18.2 

18.9 

12.9 

14.4 

+ 


a 

27.2 

24.0 

22.4 

22.5 

_ 

+ 

b 

15.9 

14.5 

15.1 

14.2 

+ 

+ ■ 

ab 

41.0 

43.9 

36.3 

39.9 


<z) Analizar los datos de este experimento. 

b) Construir una grdfica de probabilidad normal de los residuales, y graficar los residuales contra el nivel de 
vibracidn predicho. Interpretar estas gitificas. 

c) Hacer la grdfica de la interaccidn AB, Interpretar esta grdfica. LQu€ niveles del tarnano de las ranuras y 
la velocidad se recomendarian para la operacidn rutinaria? 

6-6, Considere nuevamente el experimento descrito en el problema 6-1. Suponga que el experimentador efectud 
unicamente ocho ensayos de la replica 1. Ademds, corrid cuatro puntos centrales y obtuvo los siguientes valo- 
res de la respuesta: 36, 40, 43, 45. 

a) Estimar los efectos de los faetores. LQn6 efectos son grandes? 

b) Efectuar un an&lisis de varianza, incluyendo una verificacidn de la curvatura cuadrdtica pura. CA qu6 
conclusiones se llega? 

c) Escribir un modelo apropiado para predecir la vida de la herramienta, con base en los resultados de este 
experimento. £E$te modelo difiere en alguna forma sustancial del modelo del problema 6-1, inciso c? 

d) Analizar los residuales. 

e) LA qu 6 conclusiones se llegaria acerca de las condiciones de operacidn apropiadas para este proceso? 

6-7. Se llevd a cabo un experimento para mejorar el rendimiento de un proceso quimico. Se seleccionaron cuatro 

faetores y se corrieron dos replicas de un experimento completamente aleatorizado. Los resultados se pre- 
sentan en la tabla siguiente: 


Combinacion Riplica Combinacidn Replica 


de tratamientos 

I 

II 

de tratamientos 

I 

II 

(1) 

90 

93 

d 

98 

95 

a 

74 

78 

ad 

72 

76 

b 

81 

85 

bd 

87 

83 

ab 

83 

80 

abd 

85 

86 

c 

77 

78 

cd 

99 

90 

ac 

81 

80 

acd 

79 

75 

be 

88 

82 

bed 

87 

84 

abc 

73 

70 

abed 

80 

80 
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a) Estimar los efectos de los factores. 

b) Construir la tabla del andlisis de varianza y determinar cudles factores son importantes para explicar el 
rendimiento. 

c) Escribir un modelo de regresi6n para predecir el rendimiento, suponiendo que los cuatro factores se hi- 
cieron variar en el rango de -1 a +1 (en unidades codificadas). 

d) Graficar los residuales contra el rendimiento predicho y en una escala de probabilidad normal. 6E1 an&li- 
sis residual parece ser satisfactorio? 

e) Dos interacciones de tres factores, ABC y ABD, aparentemente tienen efectos grandes. Ttazar una gr&fi- 
ca de cubo en los factores A, By C con los rendimientos promedio indicados en cada vdrtice. Repetir lo 
anterior utilizando los factores A, By D. iEstas dos gr&ficas ayudan en la interpretacidn de los datos? 
£D6nde se recomendarfa que se corriera el proceso con respecto a las cuatro variables? 

6-8. Un bacteridlogo est£ interesado en los efectos de dos medios de cultivo diferentes y dos tiempos diferentes 
sobre el crecimiento de un virus particular, Realiza seis rdplicas de un diseno 2 2 , haciendo las corridas de ma- 
nera aleatoria. Analizar los datos del crecimiento viral que se presentan enseguida y sacar las conclusiones 
apropiadas. Analizar los residuales y comentar la adecuacidn del modelo. 


Tiempo, h 


Medio de cultivo 



1 

2 



21 

22 

25 

26 

12 

23 

28 

24 

25 


20 

26 

29 

27 


37 

39 

31 

34 

18 

38 

38 

29 

33 


35 

36 

30 

35 


6-9. Un ingeniero industrial empleado por una compania refresquera estd interesado en los efectos de dos dife- 
rentes tipos de botellas de 32 onzas sobre el tiempo de entrega de cajas de 12 botellas del producto. Los dos 
tipos de botellas son de vidrio y de pl&stico. Se usan dos empleados para realizar una tarea que consiste en 
mover 40 cajas del producto 50 pies en una plataforma de carga estandar y acomodarlas en un estante de ven- 
ta. Se hacen cuatro replicas de un diseno factorial 2 2 y los tiempos observados se enlistan en la siguiente tabla. 
Analizar los datos y sacar las conclusiones apropiadas. Analizar los residuales y comentar la adecuacidn del 
modelo. 


Tipo de botella 


Empleado 



1 


2 

Vidrio 

5.12 

4.89 

6.65 

6.24 


4.98 

5.00 

5.49 

5.55 

Pl&stico 

4.95 

4.95 

5.28 

4.91 


4.27 

4.25 

4.75 

4,71 


6-10. En el problema 6-9, el ingeniero tambiSn estuvo interesado en las diferencias en la fatiga potencial que resul- 
ta de los tipos de botellas. Como una medida de la cantidad de esfuerzo requerido, midid el aumento del rit- 
mo cardiaco (pulso) inducido por la tarea. Los resultados se presentan a continuacidn. Analizar los datos y 
sacar conclusiones. Analizar los residuales y comentar la adecuacion del modelo. 
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Empleado 

Tipo de botella 1 2 


Vidrio 

39 

45 

20 

13 


58 

35 

16 

11 

Pl&stico 

44 

35 

13 

10 


42 

21 

16 

15 


6-1 1. Calcular los Krnites de confianza aproximados para los efectos de los factores del problema 6-10. £Los resul- 
tados de este an£li$is concuerdan con el an&lisis de varianza realizado en el problema 6-10? 

6-12. En un artfculo deAT&T Technical Journal (vol. 65, pp, 39-50) se describe la aplicacibn de disenos factoriales 
de dos niveles en la fabricacibn de circuitos integrados. Un paso b£sico del procesamiento es hacer crecer 
una capa epitaxial sobre obleas de silicio pulidas. Las obleas se montan en un susceptor, se colocan en el inte- 
rior de una campana de cristal y se introducen vapores qufmicos. El susceptor se hace girar y se aplica calor 
hasta que la capa epitaxial tiene el espesor suficiente. Se corrib un experimento utilizando dos factores: rapi- 
dez de flujo de arsbnico (A) y tiempo de deposicibn ( B ). Se corrieron cuatro rbplicas y se midib el espesor de 
la capa epitaxial (en //m). Los datos se muestran a continuacibn: 


Rdplica Niveles de factores 


A 

B 

I 

II 

III 

IV 


Bajo (-) 

Alto (+) 

- 

— 

14.037 

16.165 

13.972 

13.907 

A 

55% 

59% 

+ 

- 

13.880 

13.860 

14.032 

13.914 




- 

+ 

14.821 

14.757 

14.843 

14.878 

B 

Corto 

Largo 

+ 

+ 

14.888 

14.921 

14.415 

14.932 


(10 min) 

(15 min) 


a) Estimar los efectos de los factores. 

b) Conducir un analisis de varianza. LQu6 factores son importantes? 

c) Escribir una ecuacibn de regresibn que podrfa usarse para predecir el espesor de la capa epitaxial en la 
regibn de la velocidad de flujo del arsdnico y el tiempo de deposicibn utilizado en este experimento. 

d ) Analizar los residuales. 6Se observa algun residual que debiera causar preocupacibn? 

e) Comentar la forma en que se podria resolver el punto atfpico potencial encontrado en el inciso d. 
6-13. Continuacidn del problema 6-12, Usar el modelo de regresibn del inciso c del problema 6-12 para generar una 

grdfica de contomo de la superficie de respuesta para el espesor epitaxial. Suponga que es de importancia 
critica obtener un espesor de la capa de 14.5 jum. i Qud ajustes de la velocidad de flujo del arsbnico y del tiem- 
po de deposicibn se recomendarian? 

6-14. Continuacidn del problema 6-13. LEn qub forma cambiaria la respuesta dada en el problema 6-13 si la veloci- 
dad de flujo del arsbnico fuera m&s diffcil de controlar en el proceso que el tiempo de deposicibn? 
6-15. Se utiliza una aleacibn de nlquel y titanio para fabricar componentes de los motores de turbina de aviones. 
La formacibn de fisuras es un problema potencialmente serio de las piezas terminadas, ya que pueden provo- 
car fallas irreversibles. Se realiza una prueba de las piezas para determinar el efecto de cuatro factores sobre 
las fisuras. Los cuatro factores son la temperatura de vaciado (A), el contenido de titanio (5), el mbtodo de 
tratamiento tbrmico (C) y la cantidad de refinador de grano usada (D). Se hacen dos replicas de un diseno 2 4 
y se mide la longitud de las fisuras (en mm x 1(H) inducidas en un ejemplar de prueba de muestra sometido a 
una prueba estindar. Los datos se muestran en la siguiente tabla: 
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A 

B 

C 

D 

Combination de 
tratamientos 

ROplica 

I II 

- 

- 

- 

- 

(i) 

7.037 

6.376 

+ 

- 

- 

- 

a 

14.707 

15.219 

- 

+ 

- 

- 

b 

11.635 

12.089 

+ 

+ 

- 

- 

ab 

17.273 

17.815 

- 

- 

+ 

- 

c 

10.403 

10.151 

+ 

- 

+ 

- 

ac 

4.368 

4.098 

- 

+ 

+ 


be 

9.360 

9.253 

+ 

+ 

+ 

- 

abc 

13.440 

12.923 

- 

- 

- 

+ 

d 

8.561 

8.951 

+ 

- 

- 

+ 

ad 

16.867 

17.052 

- 

+ 

- 

+ 

bd 

13.876 

13,658 

+ 

+ 

- 

+ 

abd 

19.824 

19,639 

- 

- 

+ 

+ 

cd 

11.846 

12.337 

+ 

- 

+ 

+ 

acd 

6.125 

5.904 

- 

+ 

+ 

+ 

bed 

11.190 

10.935 

+ 

+ 

+ 

+ 

abed 

15.653 

15.053 


a) Estimar los efectos de los factores. LQu6 efectos de lo$ factores parecen ser grandes? 

b ) Conducir un an&lisis de varianza. ^Alguno de los factores afecta la formation de fisuras? Utilizar a — 
0,05. 

c) Escribir un modelo de regresiOn que pueda usarse para predecir la longitud de las fisuras como una fun- 
ci6n de los efectos principales y las interacciones significativas que se han identificado en el inciso b . 

d) Analizar los residuales de este experimento. 

e ) 6Hay algun indicio de que alguno de los factores afecte la variabilidad de la formation de fisuras? 

f) cQu 6 recomendaciones se harfan respecto de las operaciones del proceso? Utilizar grdficas de las inte- 
racciones y/o de los efectos principales como ayuda para sacar conclusiones. 

6-16. Continuacidn delproblema 6-15 . Una de las variables del experimento descrito en el problema 6-15, el mOtodo 

de tratamiento tOrmico (C), es una variable categOrica. Suponga que los dem&s factores son continuos. 

a) Escribir dos modelos de regresiOn para predecir la longitud de las fisuras, uno para cada nivel de la varia- 
ble mOtodo de tratamiento termico. LQu€ diferencias, en caso de haberlas, se observan en estas dos 
ecuaciones? 

b) Generar las gr&ficas de contorno apropiadas de la superficie de respuesta para los dos modelos de regre- 
siOn del inciso a. 

c) LQu 6 conjunto de condiciones se recomendaria para los factores^, B y D si se utiliza el mOtodo de trata- 
miento termico C = +? 

d) Repetir el inciso c suponiendo que quiere usarse el mOtodo de tratamiento tOrmico C = 

6-17. Un experimentador corre una sola replica de un diseno 2 4 . Se calcularon las siguientes estimaciones de los 

efectos: 


76,95 
B = -67.52 
C = -7,84 
D = -18.73 


AB = -51.32 
AC = 11.69 
AD m 9.78 
BC= 20.78 
BD - 14.74 
CD = 1.27 


ABC = -2.82 
ABD = -6.50 
ACD = 10.20 
BCD = -7.98 
ABCD = -6.25 


a) Construir una gr&fica de probabilidad normal de estos efectos. 

b) Identificar un modelo tentativo, con base en la gr&fica de los efectos del inciso a . 
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6-18. En un articulo de Solid State Technology (“Disefio ortogonal para optimizacidn de procesos y su aplicacibn en 
el grabado quimico con plasma”) se describe la aplicacibn de disenos factoriales en el desarrollo de un proce- 
so de grabado quimico con nitruros en un dispositivo de grabado quimico con plasma para una sola oblea. El 
proceso usa C 2 F 6 como gas de reaccibn. Cuatro factores son de interbs: el entrehierro dnodo-cdtodo (j 4), la 
presibn en la c£mara del reactor (B), el flujo del gas C 2 F 6 (C) y la potencia aplicada al c£todo (D). La respues- 
ta de interns es la rapidez de grabado para el nitruro de silicio. Se corre una sola rbplica de un diseno 2 4 ; los 
datos se muestran enseguida: 


Ntimero de 
corrida 

Orden real de 
la corrida 

A 

B 

C 

D 

Rapidez de grabadc 
(A/min) 

Niveles de los factores 

Bajo (-) 

Alto (+) 

1 

13 

— 

— 

— 

— 

550 

A (cm) 0.80 

1.20 

2 

8 

+ 

- 


- 

669 

B (mTorr) 450 

550 

3 

12 

— 


- 

- 

604 

C (SCCM) 125 

200 

4 

9 

+ 

+ 

- 

- 

650 

D (W) 275 

325 

5 

4 

— 

- 

+ 

- 

633 



6 

15 

+ 

- 

+ 


642 



7 

16 


+ 

+ 

- 

601 



8 

3 

+ 

+ 

+ 

- 

635 



9 

1 

- 

- 

- 

+ 

1037 



10 

14 

+ 

- 

- 

+ 

749 



11 

5 

- 

+ 

- 

+ 

1052 



12 

10 

+ 

+ 

- 

+ 

868 



13 

11 

- 

- 

+ 

+ 

1075 



14 

2 

+ 

- 

+ 

+ 

860 



15 

7 

- 

+ 

+ 

+ 

1063 



16 

6 

+ 

+ 

+ 

+ 

729 




a) Estimar los efectos de los factores. Considere una grifica de probabilidad normal de los efectos de los 
factores. LQu6 efectos parecen ser grandes? 

b) Efectuar un an&lisis de varianza para confirmar los resultados obtenidos en el inciso a . 

c ) £Cu£l es el modelo de regresi6n que relaciona la rapidez de grabado con las variables significativas del 
proceso? 

d) Analizar los residuales de este experimento. Comentar la adecuacibn del modelo. 

e) Si no todos los factores son importantes, hacer la proyeccibn del diseno 2 4 en un diseno 2 k con k < 4 y 
conducir el an&lisis de varianza. 

f) Ttazar gr£ficas para interpretar cualquier interaccibn significativa, 

g ) Graficar los residuales contra el orden real de las corridas. <i.Qub problemas podrian ponerse de mani- 
fiesto en esta grdfica? 

6-19. Continuaeidn delproblema 6-18 . Considere el modelo de regresibn obtenido en el inciso c del problema 6-18. 

a) Construir las grdficas de contomo de la rapidez de grabado utilizando este modelo. 

b) Suponga que fuera necesario operar este proceso con una rapidez de 800 A/min. 6 Curies serian los ajus- 
tes de las variables del proceso que se recomendarian? 

6-20. Considere la replica unica del diseno 2 4 del ejemplo 6-2. Suponga que se decidib arbitrariamente analizar los 
datos suponiendo que las interacciones de tres y cuatro factores eran insignificantes. Conducir este an&lisis y 
comparar los resultados con los que se obtuvieron en el ejemplo. 6Piensa el lector que es una buena idea su- 
poner de manera arbitraria que las interacciones son insignificantes incluso cuando sean de orden relativa- 
mente alto? 

6-21. Se realizb un experimento en una fdbrica de semiconductores en un esfuerzo para incrementar el rendimien- 
to. Se estudiaron cinco factores, cada uno con dos niveles. Los factores (y los niveles) fueron: A = ajuste de 
apertura (pequena, grande), B = tiempo de exposicidn (20% abajo del nominal, 20% arriba del nominal), 
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C — tiempo de desarrollo (30 s, 45 s), D = tamano de la m&scara (pequena, grande) y E — tiempo de grabado 
(14.5 min, 15.5 min). Se corrib el diseno 2 5 no replicado que se muestra a continuacibn. 


(1) = 7 

00 

il 

^3 

a — 9 

ad = 10 

b = 34 

bd — 32 

un 

fl 

abd = 50 

c = 16 

cd = 18 

ac = 20 

acd = 21 

be — 40 

bed — 44 

abc =60 

abed = 61 


e = 8 

IE 

ae = 12 

ade ~ 10 

be = 35 

bde = 30 

abe = 52 

abde - 53 

ce = 15 

ede = 15 

ace — 22 

aede — 20 

bee = 45 

bode ~ 41 

abce — 65 

abcde= 63 


a) Construir una grafica de probabilidad normal de las estimaciones de los efectos. LQu6 efectos parecen 
ser grandes? 

b) Efectuar un an&lisis de varianza para confirmar los resultados obtenidos en el inciso a . 

c) Escribir el modelo de regresidn que relacione el rendimiento con las variables significativas del proceso. 

d) Graficar los residuales en papel probabilidad normal. 6La grafica es satisfactory? 

e) Graficar los residuales contra los rendimientos predichos y contra cada uno de los cinco factores. Co- 
mentar las gr£ficas, 

/ ) Interpretar cualquier interaccidn significativa. 

g) ZQue recomendaciones se harian respecto de las condiciones de operacidn del proceso? 

h) Hacer la proyeccion del diseno 2 5 de este problema en un diseno 2 k en los factores importantes. Esque- 
matizar el diseno e indicar el promedio y el rango de los rendimientos en cada corrida. ZEs de ayuda este 
esquema para interpretar los resultados de este experimento? 

6-22. Continuacidn delproblema 6-21 . Suponga que el experimentador corrib cuatro puntos centrales ademas de los 
32 ensayos del experimento original. Los rendimientos obtenidos en las corridas de los puntos centrales fue- 
ron 68, 74, 76 y 70. 

a) Analizar de nuevo el experimento, incluyendo una prueba para la curvatura cuadratica pura. 

b) Comentar cual seria el siguiente paso. 

6-23. Se estudiaron cuatro factores, cada uno con dos niveles, en un estudio del rendimiento de un proceso: el 
tiempo (A), la concentracidn (B), la presion (C) y la temperatura (Z)), Se corrib una sola rdplica de un diseno 
2* y los datos obtenidos se muestran en la siguiente tabla: 


Numero de 
corrida 

Orden real de 
la corrida 

A 

B 

C 

D 

Rendimiento 

(lbs) 

Niveles de los factores 
Bajo (-) Alto (+) 

1 

5 

- 

- 

- 

- 

12 

^(h) 

2,5 

3 

2 

9 

+ 

- 

- 

- 

18 

B(%) 

14 

18 

3 

8 

- 

+ 

- 

- 

13 

C (psi) 

60 

80 

4 

13 

+ 

+ 

- 

- 

16 

£>(°C) 

225 

250 

5 

3 

- 

- 

+ 

- 

17 




6 

7 

+ 

- 

+ 

- 

15 




7 

14 

- 

> 

+ 

- 

20 




8 

1 

+ 

+ 

+ 

- 

15 




9 

6 

- 


- 

+ 

10 




10 

11 

+ 

- 

- 

+ 

25 




11 

2 

- 

+ 

- 

+ 

13 




12 

15 

+ 

+ 

- 

+ 

24 




13 

4 

- 

- 

+ 


19 




14 

16 

+ 

- 

+ 

+ 

21 




15 

10 

- 

+ 

+ 

+ 

17 




16 

12 

+ 

+ 

+ 

+ 

23 






6'7 PROBLEMAS 283 

a) Construir una gr&fica de probabilidad normal de las estimaciones de los efectos, LQxx6 factores parecen 
tener efectos grandes? 

b) Efectuar un anSlisis de varianza utilizando la gr&fica de probabilidad normal del inciso a como guia para 
formar el tdrmino del error. LA qud conclusiones se Uega? 

c) Escribir un modelo de regresion que relacione el rendimiento con las variables importantes del proceso. 

d) Analizar los residuales de este experimento. LE\ an£lisis indica algun problema potencial? 

e) IBs posible plegar este diseno a un diseno 2 3 con dos rdplicas? De ser asi, esquematizar el diseno con el 
promedio y el rango del rendimiento indicados en cada punto del cubo. Interpretar los resultados. 

6-24. Continuacidn del problema 6-23. Usar el modelo de regresidn del inciso c del problema 6-23 para generar una 
gr&fica de contomo de la superficie de respuesta del rendimiento. Analizar el valor pr&ctico de esta gr^fica 
de superficie de respuesta. 

6-25 . El experimento del brownie (pastelito) exquisito * El autor es un ingeniero hecho en la practica y un firme creyen- 
te de aprender haciendo las cosas. Durante muchos anos ha impartido el curso de diseno experimental a una 
amplia variedad de audiencias y siempre asigna la planeacidn, realizacidn y an&lisis de un experimento real a 
los participantes de la clase. Los participantes parecen disfrutar esta experiencia prdctica y siempre 
aprenden mucho de ella. En este problema se utilizan los resultados de un experimento realizado por Gret- 
chen Krueger en la Universidad Estatal de Arizona. 

Existen muchas formas diferentes de hornear brownies. El propdsito de este experimento fue determinar 
la forma en que el material del molde, la marca de la harina para brownies y el mdtodo de batido afectan la 
exquisitez de los brownies. Los niveles de los factores fueron: 


Factor 

Bajo (-) 

Alto (+) 

A = material del molde 

Vidrio 

Aluminio 

B = mdtodo de batido 

Cuchara 

Batidora 

C = marca de la harina 

Cara 

Barata 


La variable de respuesta fue la exquisitez, una medida subjetiva derivada de un cuestionario aplicado a los 
sujetos que hicieron el muestreo de cada lote de brownies. (Este cuestionario incluia aspectos como el sabor, 
la apariencia, la consistencia, el aroma, etc.) Un panel de prueba integrado por ocho personas hizo el mues- 
treo de cada lote y llend el cuestionario. La matriz del diseno y los datos de la respuesta se presentan a conti- 
nuacidn: 


Lote de 
brownies 

A 

B 

C 



Resultados del panel de prueba 



1 

2 

3 

4 

5 

6 

7 

8 

1 

- 

- 

- 

11 

9 

10 

10 

11 

10 

8 

9 

2 

+ 

- 

- 

15 

10 

16 

14 

12 

9 

6 

15 

3 

- 

+ 

- 

9 

12 

11 

11 

11 

11 

11 

12 

4 

+ 

+ 

- 

16 

17 

15 

12 

13 

13 

11 

11 

5 

- 

- 

+ 

10 

11 

15 

8 

6 

8 

9 

14 

6 

+ 

- 

+ 

12 

13 

14 

13 

9 

13 

14 

9 

7 

- 

+ 

+ 

10 

12 

13 

10 

7 

7 

17 

13 

8 

+ 

+ 

+ 

15 

12 

15 

13 

12 

12 

9 

14 


a) Analizar los datos de este experimento como si se tratara de ocho rdplicas de un diseno 2 3 . Comentar los 
resultados. 
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b ) LE\ an£lisis del inciso a es el enfoque correcto? Hay unicamente ocho lotes; 6se tienen en realidad ocho 
rbplicas de un diseiio factorial 2 3 ? 

c) Analizar el promedio y la desviacibn estdndar del puntaje de la exquisitez. Comentar los resultados, 
£Este andlisis es mis apropiado que el del inciso a? £Por qub si o no? 

6-26. Se condujo un experimento en un proceso quimico para producir un polimero. Los cuatro factores estudia- 
dos fueron la temperatura (^4), la concentracibn del catalizador (5), el tiempo (C) y la presibn (D), Se obser- 
varon dos respuestas, el peso molecular y la viscosidad. La matriz del disefio y los datos de la respuesta se 
presentan a continuacibn: 


Numero 
de corrida 

Orden real de 
las corridas 

A 

B 

c 

D 

Peso 

molecular 

Viscosidad 

Niveles de los factores 

Bajo (-) 

Alto (+) 

1 

18 

— 

— 

— 

- 

2400 

1400 

ACC) 

100 

120 

2 

9 

+ 

- 

- 

- 

2410 

1500 

B(%) 

4 

8 

3 

13 

- 

+ 

- 

- 

2315 

1520 

C (min) 

20 

30 

4 

8 

+ 

+ 

- 

- 

2510 

1630 

D (psi) 

60 

IS 

5 

3 

- 

- 

+ 

- 

2615 

1380 




6 

11 

+ 

- 

+ 

- 

2625 

1525 




7 

14 

- 

+ 

+ 

- 

2400 

1500 




8 

17 

+ 

+ 

+ 

- 

2750 

1620 




9 

6 

- 

- 

- 

+ 

2400 

1400 




10 

7 

+ 

- 

- 

+ 

2390 

1525 




11 

2 

- 

+ 

- 

+ 

2300 

1500 




12 

10 

+ 

+ 

- 

+ 

2520 

1500 




13 

4 

- 


+ 

+ 

2625 

1420 




14 

19 

+ 

- 

+ 

+ 

2630 

1490 




15 

15 

- 

+ 

+ 

+ 

2500 

1500 




16 

20 

+ 

+ 

+ 

+ 

2710 

1600 




17 

1 

0 

0 

0 

0 

2515 

1500 




18 

5 

0 

0 

0 

0 

2500 

1460 




19 

16 

0 

0 

0 

0 

2400 

1525 




20 

12 

0 

0 

0 

0 

2475 

1500 





a) Considere tinicamente la respuesta del peso molecular. Graficar las estimaciones de los efectos en una 
escala de probabilidad normal. 6Qub efectos parecen ser importantes? 

b) Usar un anilisis de varianza para confirmar los resultados del inciso a . 6 Hay algun indicio de curvatura? 

c ) Escribir un modelo de regresibn para predecir el peso molecular como una funcibn de las variables im- 
portantes. 

d) Analizar los residuos y comentar la adecuacibn del modelo. 

e) Repetir los incisos a-d utilizando la respuesta de la viscosidad. 

6-27. Continuacidn del problema 6-26 . Utilizar los modelos de regresibn del peso molecular y la viscosidad para res- 
ponder las preguntas siguientes. 

a) Construir una grifica de contomo de la superficie de respuesta para el peso molecular. 6En qu 6 direc- 
cibn se ajustarlan las variables del proceso a fin de incrementar el peso molecular? 

b) Construir una grdfica de contomo de la superficie de respuesta para la viscosidad. 4En qub direccibn se 
ajustarfan las variables del proceso para disminuir la viscosidad? 
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c ) £Qud condiciones de operacidn se recomendarian si fuera necesario producir un producto con peso mo- 
lecular entre 2400 y 2500, y con la viscosidad mis baja posible? 

6-28. Considere una sola r6plica del diseno 2 4 del ejemplo 6-2. Suponga que se hicieron cinco corridas de puntos en 
el centro (0, 0, 0, 0) y que se observaron las respuestas siguientes; 73, 75, 71, 69 y 76. Probar la curvatura en 
este experimento. Interpretar los resultados, 

6-29. Un valor faUante en un diseno factorial 2 k . No es raro encontrar que falta una de las observaeiones de un diseno 
2* debido a un equipo de medicidn defectuoso, una prueba fallida, o alguna otra razdn. Si el diseno se hace 
con n riplicas ( n > 1), puede emplearse alguna de las t6cnicas estudiadas en el capftulo 5. Sin embargo, para 
un diseno factorial sin riplicas ( n = 1) debe usarse otro mdtodo. Un enfoque ldgico es estimar el valor faltan- 
te con un numero que haga cero el contraste de la interaccidn de orden mis alto. Aplicar esta tdcnica al expe- 
rimento del ejemplo 6-2, suponiendo que falta la corrida ah. Compare los resultados obtenidos con los del 
ejemplo 6-2. 

6-30. Un ingeniero realizd un experimento para estudiar el efecto de cuatro factores sobre la aspereza superficial 
de una pieza maquinada. Los factores (y sus niveles) son^4 = ingulo de la henamienta (12, 15°), B = viscosi- 
dad del fluido de corte (300, 400), C = velocidad de alimentacidn (10, 15 pulg/min) y D - enfriador del fluido 
de corte usado (no, si). Los datos de este experimento (con los factores codificados en los niveles usuales -1, 
+ 1) se muestran a continuation. 


Corrida 

A 

B 

C 

D 

Rugosidad superficial 

1 

— 


— 

- 

0.00340 

2 

+ 

- 

- 

- 

0.00362 

3 

- 

-1- 

— 

- 

0.00301 

4 

+ 

-1- 

_ 

- 

0.00182 

5 


- 

+ 

- 

0.00280 

6 

+ 

- 

+ 

- 

0.00290 

7 

- 

-1- 

+ 

- 

0.00252 

8 

+ 

+ 

+ 

- 

0.00160 

9 

- 

— 

- 

+ 

0.00336 

10 

+ 

— 


+ 

0.00344 

11 


+ 

- 

+ 

0.00308 

12 

+ 

+ 

- 

+ 

0.00184 

13 

_ 

_ 

+ 

+ 

0.00269 

14 

+ 

- 

+ 

+ 

0.00284 

15 

- 

+ 

+ 

+ 

0.00253 

16 

+ 

+ 

+ 

+ 

0.00163 


a) Estimar los efectos de los factores. Representar las efectos de los factores en una grifica de probabilidad 
normal y seleccionar un modelo tentativo. 

b) Ajustar el modelo identificado en el inciso a y analizar los residuales. £Hay algun indicio de que el mode- 
lo no sea adecuado? 

c) Repetir el anilisis de los incisos a y b utilizando 1/y como la variable de respuesta. £Hay algun indicio de 
que la transformation ha sido util? 

d) Ajustar un modelo en tdrminos de las variables codificadas que pueda usarse para predecir la rugosidad 
superficial. Convertir esta ecuaciOn de predicci6n en un modelo en las variables naturales. 

6-31. La resistividad de una oblea de silicio esti influida por varios factores. Los resultados de un experimento fac- 
torial 2 4 realizado durante un paso critico del procesamiento se muestran en la tabla siguiente: 
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Corrida 

A 

B 

c 

D 

Resistividad 

1 

- 

— 

— 

— 

1.92 

2 

+ 

- 

- 

~ 

11.28 

3 

- 

E 

- 

- 

1.09 

4 

+ 

E 

- 

- 

5.75 

5 

- 

- 

E 

- 

2.13 

6 

+ 

- 

+ 

- 

9.53 

7 

- 

E 

E 

- 

1,03 

8 

+ 

+ 

E 

- 

5,35 

9 

- 

- 

- 

E 

1.60 

10 

+ 

- 

- 

E 

11.73 

11 

- 

+ 

- 

E 

1.16 

12 

E 

E 

- 

+ 

4.68 

13 


- 

E 

+ 

2.16 

14 

+ 

- 

E 

E 

9.11 

15 

- 

E 

E 

E 

1.07 

16 

E 

E 

+ 

E 

5.30 


a) Estimar los efectos de los factores. Representar las efectos de los factores en una gr&fica de probabilidad 
normal y seleccionar un modelo tentativo. 

b) Ajustar el modelo identificado en el inciso a y analizar los residuales. £Hay algun indicio de que el mode- 
lo no sea adecuado? 

c) Repetir el an£lisis de los incisos a y b utilizando In (y) como la variable de respuesta. 6Hay algun indicio 
de que la transformacidn haya sido titil? 

d) Ajustar un modelo en t^rminos de las variables codificadas que pueda usarse para predecir la resistivi- 
dad. 

6-32. Continuacidn del problema 6-3L Suponga que el experimentador corrid tambidn cuatro puntos centrales jun- 
to con las 16 corridas del problema 6-31. Las mediciones de la resistividad en los puntos centrales son: 8.15, 
7.63, 8.95 y 6.48. Analizar de nuevo el experimento incorporando los puntos centrales. 6Qu6 conclusiones 
pueden sacarse ahora? 

6-33. Es frecuente usar el modelo de regresidn ajustado de un diseno factorial 2 k para hacer predicciones en pun- 
tos de interes del espacio del diseno. 

a) Encontrar la varianza de la respuesta predicha p en un punto * 1 , x 2 , ...,x k del espacio del diseno. Sugeren- 
cia: recuerde que las* est&n codificadas, y suponga un diseno 2 k con el mismo numero de r6plicas n en 
cada punto del diseno, de tal modo que la varianza de un coeficiente de regresidn /? sea a 2 /(nl k ) y que la 
covarianza entre cualquier par de coeficientes de regresidn sea cero, 

b) Usar el resultado del inciso a para encontrar la ecuacidn de un intervalo de confianza de 100(1 - a) por 
ciento para la verdadera respuesta media en el punto x u x 2i ...» x k del espacio del diseno. 

6-34. Modelos jerdrquicos. Se ha usado varias veces el principio de jerarquia para seleccionar un modelo; es decir, 
se han incluido t£rminos de orden inferior no significativos en un modelo porque eran factores que estaban 
incluidos en tdrminos de orden superior significativos. Ciertamente, la jerarquia no es un principio absoluto 
que deba seguirse en todos los casos. Para ilustrar esto, considere el modelo que resultd en el problema 6-1, 
el cual requirid que se incluyera un efecto principal no significative para respetar la jerarquia. Utilizar los da- 
tos del problema 6-1. 

a) Ajustar el modelo jer&rquico y el modelo no jerdrquico. 

b) Calcular el estadistico PRESS, la R 2 ajustada y el cuadrado medio del error para ambos modelos. 

c) Encontrar un intervalo de confianza de 95% para la estimacidn de la respuesta media en el v6rtice de un 
cubo (*! = x 2 = * 3 = ±1). Sugerencia : usar los resultados del problema 6-33. 

d) Con base en los an£lisis que se han realizado, 6qu6 modelo preferiria el lector? 




Formation de 

bloques y confusion 

en el diseno 

factorial 2 k 


7*1 INTRODUCClON 

Hay multiples situaciones en las que es imposible efectuar todas las corridas de un experimento factorial 
2 k bajo condiciones homogeneas. Por ejemplo, un lote de materia prima podria no ser suficiente para ha- 
cer todas las corridas requeridas. En otros casos, podria ser conveniente modificar deliberadamente las 
condiciones experimentales para asegurar que los tratamientos tengan la misma efectividad (es decir, que 
sean robustos) en diversas situaciones que es posible encontrar en la practica. Por ejemplo, un ingeniero 
qufmico puede correr un experimento en una planta piloto con varios lotes de materia prima porque sabe 
que en el proceso real a gran escala posiblemente se usar&n diferentes lotes de materia prima con diversos 
grados de calidad. 

La tdcnica de diseno utilizada en estas situaciones es la formacidn de bloques. Este capltulo se enfoca 
en algunas tdcnicas especiales para separar en bloques un diseno factorial 2 k . 

7-2 FORMACI6N DE BLOQUES DE UN DISENO FACTORIAL 2 k CON REPLICAS 

Suponga que se han corrido n replicas del diseno factorial 2 k . Esta situacidn es iddntica a la que se estudid 
en el capltulo 5, donde se indicd como correr un diseno factorial general en bloques. Si hay n rdplicas, en- 
tonces cada conjunto de condiciones no homogeneas define un bloque, y cada replica se corre en uno de 
los bloques. Las corridas de cada bloque (o rdplica) se harian de manera aleatoria. El an&lisis del diseno 


labia 7-1 Experimento del proceso qufmico en tres bloques 


Bloque 1 

Bloque 2 

Bloque 3 

(1) = 28 


(1) = 25 


(1) = 27 

a = 36 


a =32 


a = 32 

b = 18 


b = 19 


b = 23 

ab = 31 


ab = 30 


ab = 29 


Ibtales de los bloques 1?, - 113 B 2 = 106 = ill 


287 
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labia 7-2 An&lisis dc varianza del experimento del proceso qufmico en tres bloques 


Fuente de variacidn 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

F 0 

Valor P 

Bloques 

6.50 

2 

3.25 



A (concentracidn) 

208.33 

1 

208.33 

50.32 

0.0004 

B (catalizador) 

75.00 

1 

75.00 

18.12 

0.0053 

AB 

8.33 

1 

8.33 

2.01 

0.2060 

Error 

24.84 

6 

4,14 



Tbtal 

323.00 

11 





es similar al de cualquier experimento factorial separado en bloques; por ejemplo, vease la revisi6n de la 
seccidn 5-6. 

EJEMPLO 7-1 • 

Considere el experimento del proceso qufmico que se describe en la seccidn 6-2, Suponga que s61o pue- 
den hacerse cuatro ensayos experimentales con un solo lote de materia prima. Por lo tanto, se necesitaran 
tres lotes de materia prima para correr las tres replicas de este diseno. En la tabla 7-1 se muestra el diseno 
donde cada lote de materia prima corresponde a un bloque. 

En la tabla 7-2 se muestra el an&lisis de varianza de este diseno separado en bloques. Todas las sumas 
de cuadrados se calculan exactamente igual que en un diseno 2 k est&ndar sin formation de bloques. La 
suma de cuadrados de los bloques se calcula a partir de los totales de los bloques. Sea que B h B 2 y B 3 re- 
presenten los totales de los bloques (ver la tabla 7-1). Entonces 

3 n2 2 

ss -L, 

M Bloques Zj 4 

(113) 2 +(106) 2 +(111) 2 (330) 2 

4 12 

= 6.50 

Hay dos grados de libertad entre los tres bloques. La tabla 7-2 indica que las conclusiones de este andlisis, 
si el diseno se hubiera corrido en bloques, son iddnticas a las de la seccidn 6-2 y que el efecto de los blo- 
ques es relativamente pequeno. 


7'3 CONFUSION DEL DISENO FACTORIAL 2 k 

Hay muchos problemas en los que es imposible realizar una replica completa de un diseno factorial en un 
bloque. La confiisidn (o mezclado) es una tdcnica de diseno mediante la cual un experimento factorial 
completo se distribuye en bloques, donde el tamano del bloque es menor que el numero de combinacio- 
nes de los tratamientos de una replica. La tecnica hace que la information acerca de ciertos efectos de los 
tratamientos (por lo general las interacciones de orden superior) sea indistinguible de los bloques 0 estd 
confundida con los bloques. En este capitulo la atencidn se centra en los sistemas de confusion (o mezcla- 
do) para el diseno factorial 2 k . Observe que aun cuando los disenos que se presentan son diseiios de blo- 
ques incompletos, ya que cada bloque no contiene todos los tratamientos o las combinaciones de los 
tratamientos, la estructura especial del sistema factorial 2 k permite un metodo de andlisis simplificado. 

Se considera la construccibn y el analisis del diseno factorial 2 k en 2 P bloques incompletos, donde 
p < k. Por consiguiente, estos disenos pueden correrse en dos bloques, en cuatro bloques, en ocho blo- 
ques, etcetera. 
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7-4 CONFUSI6N DEL DISENO FACTORIAL 2 k EN DOS BLOQUES 

Suponga que quiere correrse una sola rbplica del diseno 2 2 . Cada una de las 2 Z = 4 combinaciones de los 
tratamientos requiere una cantidad de materia prima, por ejemplo, y cada lote de materia prima solo al- 
canza para probar dos combinaciones de tratamientos. Por lo tanto, se necesitan dos lotes de materia pri- 
ma. Si los lotes de materia prima se consideran como bloques, entonces deben asignarse a cada bloque 
dos de las cuatro combinaciones de tratamientos. 

En la figura 7-1 se muestra uno de los disenos posibles para este problema. La vista geometrica, figu- 
ra 7-la, indica que las combinaciones de tratamientos localizadas en diagonales opuestas se asignan a blo- 
ques diferentes. Observe, por la figura 7- 1ft, que el bloque 1 contiene las combinaciones de los 
tratamientos (1) y aft y que el bloque 2 contiene a y ft. Desde luego, el orden en que se corren las combina- 
ciones de los tratamientos dentro de un bloque se determina aleatoriamente. Thmbien se decidira aleato- 
riamente cual de los bloques se correrti primero. Suponga que los efectos principales de A y B se estiman 
como si no se hubiera hecho la formacibn de bloques. Por las ecuaciones 6-1 y 6-2 se obtiene 

. 4 = i[aft+a-ft-(l)] 

B = \[ab+b- a- (\)] 

Observe que ni A ni B son afectados por la formacibn de bloques, debido a que en cada estimacibn hay 
una combinadbn de un tratamiento positivo y uno negativo de cada bloque. Es decir, cualquier diferencia 
entre el bloque 1 y el bloque 2 se cancela. 

Considere ahora la interaccibn AB 


AB = j[aft+(l)-a-ft] 

Puesto que las dos combinaciones de tratamientos con signo positivo [aft y (1)] est£n en el bloque 1 y las 
dos con signo negativo (a y ft) est<in en el bloque 2, el efecto de los bloques y la interaccibn AB son idbnti- 
cos. Es decir, AB e$t& confundido (o mezdado) con los bloques. 

La razbn de esto es evidente en la tabla de signos positivos y negativos del diseno 2 2 . Se presentb origi- 
nalmente en la tabla 6-2, pero por conveniencia se repite como la tabla 7-3. A partir de esta tabla se observa 
que todas las combinadones de tratamientos que tienen signo positivo para AB se asignan al bloque 1, 


B 


• - Corrida en el bloque 1 
O - Corrida en el bloque 2 


• -■ 

A 

+ 

a) Vista geometrica 



Bloque 1 

Bloque 2 


(D 


a 


ab 


b 


b) Asignacidn de las cuatro 
corridas en dos bloques 


Figura 7-1 Diseno 2 Z en dos bloques. 
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labia 7-3 Tabla de signos positivos y negativos para el disefio 2 2 


Combinaci6n de 
tratamientos 


Efecto factorial 


I 

A 

B 

AB 

(i) 

+ 

- 

- 

+ 

a 

+ 

+ 

- 

- 

b 

+ 

- 

+ 

- 

ab 

+ 

+ 

+ 

+ 


mientras que todas las combinaciones de tratamientos que tienen signo negativo para AB se asignan al 
bloque 2. Este enfoque puede usarse para confundir o mezclar cualquier efecto (A, B o AB) con los blo- 
ques. Por ejemplo, si (1) y b se hubieran asignado al bloque 1 y a y ab al bloque 2, el efecto principal d cA 
se habria confundido con los bloques. La pr&ctica usual es confundir la interaccidn de orden mas alto con 
los bloques. 

Este esquema puede usarse para confundir o mezclar cualquier diseno 2 k en dos bloques. Como un 
segundo ejemplo, considere un diseno 2 3 que se corre en dos bloques. Suponga que se quiere confundir la 
interaccidn de los tres factores ABC con los bloques. Por la formacidn de signos positivos y negativos de la 
tabla 7-4, las combinaciones de tratamientos que son negativas para ABC se asignan al bloque 1 y las que 
son positivas para ABC al bloque 2. El diseno resultante se muestra en la figura 7-2. De nueva cuenta se 
resalta que las combinaciones de tratamientos dentro de un bloque se corren de manera aleatoria. 

Otros metodos para construir bloques 

Se cuenta con otro metodo para construir estos disenos. El metodo utiliza la combination lineal 

L= a l x l +a 2 x 1 +...+a k x k (7-1) 

dondex, es el nivel del factor i-6simo que aparece en una combinacidn de tratamientos particular y a, es el 
exponente que aparece en el factor i-6simo para el efecto que va a confundirse. Para el sistema 2\ se tiene 
aj ,= 0 o 1 yXi = 0 (nivel bajo) ox, = 1 (nivel alto). A la ecuacidn 7-1 se le llama la deflnicidn de contrastes. 
Las combinaciones de tratamientos que producen el mismo valor de L (mod 2) se colocaran en el mismo 
bloque. Puesto que los unicos valores posibles deL (mod 2) son Oy 1, con esto las 2 k combinaciones de tra- 
tamientos se asignardn a exactamente dos bloques. 


Tabla 7-4 Tabla de signos positivos y negativos para el disefio 2 3 


Combinacidn de 
tratamientos 




Efecto factorial 




I 

A 

B 

AB 

c 

AC 

BC 

ABC 

(i) 

+ 

- 

- 

+ 

- 

+ 


- 

a 

+ 

+ 

- 

- 

- 

- 

+ 

+ 

b 

+ 

- 

+ 

- 

- 

+ 

- 

+ 

ab 

+ 

+ 

+ 

+ 

- 

- 

- 

- 

c 

+ 

- 

- 

+ 

+ 

- 

- 


ac 

+ 

+ 

- 

- 

+ 

+ 

- 

- 

be 

+ 

- 

+ 

- 

+ 

- 

+ 

- 

abc 

+ 

+ 

+ 

4- 

+ 

4* 

+ 

+ 
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Bloque 1 

( 1 ) 

ab 

ac 

be 


• = Corrida an al bloque 1 
O * Corrida an al bloque 2 



Bloque 2 


a 

b 

c 

abc 


b) Asignacibn da las ocho 
corridas en dos bloques 

Figure 7-2 El disefio 2 3 en dos bloques coiMBC confun- 
dido. 


Para ilustrar este enfoque, considere un diseno 2 3 con ABC confundido con los bloques. En este caso, 
x 3 corresponds aA,x 2 &B,x 3 aCya 1 =a 2 = ct 3 = 1. Por lo tanto, la definition del contraste correspondien- 
te a ABC es 

L = +x 2 + * 3 

La combinacion de tratamientos (1) se escribe 000 en la notacibn (0, 1); por lo tanto, 

L= 1(0)+1(0)+1(0) = 0= 0 (mod 2) 

De manera similar, la combination de tratamientos a es 100, obteniendose 

L= 1(1)+1(0)+1(0) =1 = 1 (mod 2) 

Por lo tanto, (1) y a se correrian en bloques diferentes. Para el resto de las combinaciones de tratamientos 
se tiene 

b: L= 1(0)+1(1)+1(0)= 1 = 1 (mod 2) 
ab : L= 1(1)+1(1)+1(0)= 2=0 (mod 2) 
c: L= 1(0)+1(0)+1(1) = 1 = 1 (mod 2) 
ac: L= 1(1)+1(0)+1(1)= 2=0 (mod 2) 
be: L= 1(0)+1(1)+1(1)= 2=0 (mod 2) 
abc : L— 1(1) +1(1) +1(1)= 3= 1 (mod 2) 

Por lo tanto, (1), ab, ac y be se corren en el bloque 1 y a, b, c y abc se corren en el bloque 2. Se trata del mis- 
mo diseno que se ilustrb en la figura 7-2, el cual se genero con la tabla de signos positivos y negativos. 

Puede usarse otro metodo para construir estos disenos. Al bloque que contiene la combination de 
tratamientos (1) se le llama el bloque principal. Las combinaciones de los tratamientos incluidas en este 
bloque poseen una titil propiedad de la teoria de grupos; a saber, forman un grupo con respecto a la multi- 
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plication modulo 2. Esto implica que cualquier elemento [con excepcidn de (1)] del bloque principal pue- 
de generarse multiplicando otros dos elementos del bloque principal mddulo 2. Por ejemplo, considere el 
bloque principal del diseno 2 3 con ABC confundido, como se muestra en la figura 7-2. Observe que 

ab-ac= a 2 bc - be 
ab'bc= ab 2 c = ac 
ac'bc = abc 2 = ab 


Las combinaciones de tratamientos del otro bloque (o bloques) pueden generarse multiplicando uno de 
los elementos del nuevo bloque por cada uno de los elementos del bloque principal modulo 2. Para el di- 
seno 2 3 con ABC confundido, puesto que el bloque principal es (1), ab, ac y be , se sabe que b est& en el otro 
bloque. Por lo tanto, los elementos de este segundo bloque son 

Ml) =b 

b‘ ab — ab 2 = a 
b-ac = abc 

b'bc — b 2 c = c. 


Estos resultados concuerdan con los que se obtuvieron anteriormente. 

Estimation del error 

Cuando el numero de variables es pequeno, por ejemplo k — 2 o 3, por lo general es necesario hacer repli- 
cas del experimento a fin de obtener una estimacidn del error, Por ejemplo, suponga que un diseno facto- 
rial 2 3 debe correrse en dos bloques con ABC confundido, y el experimentador decide hacer cuatro 
replicas del diseno. El diseno resultante podria verse como el de la figura 7-3. Observe que, ABC est& con- 
fundido en cada replica. 

En la tabla 7-5 se muestra el an&lisis de varianza de este diseno. Hay 32 observaciones y 31 grados de 
libertad. Ademds, puesto que hay ocho bloques, siete grados de libertad deben asociarse con estos blo- 
ques. En la tabla 7-5 se presenta la descomposicidn de esos siete grados de libertad. La suma de cuadra- 
dos del error se compone en realidad de las interacciones de dos factores entre las replicas, y cada uno de 
los efectos ( A , B , C, AB, AC, BC). Por lo general es seguro considerar que las interacciones son cero y tra- 
tar el cuadrado medio resultante como una estimation del error. Los efectos principales y las interaccio- 
nes de dos factores se prueban contra el cuadrado medio del error. Cochran y Cox [25b] hacen notar que 
el cuadrado medio del bloque o ABC podria compararse con el error del cuadrado medio ABC, que es en 
realidad replicas x bloques. Esta prueba suele tener una sensibilidad muy baja. 

Si se cuenta con recursos suficientes para hacer replicas de un diseno confundido, por lo general es 
mejor usar un m6todo ligeramente diferente para disenar los bloques en cada replica. Este enfoque con- 
siste en confundir un efecto diferente en cada replica para obtener cierta informacidn sobre todos los 


R6plica I Replica II Replica IIJ Replica IV 


Bloque 1 Bloque 2 Bloque 1 Bloque 2 Bloque 1 Bloque 2 Bloque ^ Bloque 2 
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Tabla 7-5 An&lisis de varian 2 a de cuatro replicas de un 
diseno 2 3 con ABC confundido 


Fuente de variacidn 

Grados de 
libertad 

R6plicas 

3 

Bloques (ABC) 

1 

Error de ABC (r6plicas x bloques) 

3 

A 

1 

B 

1 

C 

1 

AB 

1 

AC 

1 

BC 

1 

Error (o rdplicas x efectos) 

18 

Total 

31 


efectos. A este procedimiento se le llama confusion (o mezclado) part ial, y se estudia en la section 7-7. Si 
k es moderadamente grande, por ejemplo k > 4, con frecuencia solo es posible hacer una r6plica. El expe- 
rimentador suele suponer que las interacciones de drdenes superiores son insignificantes y combina sus 
sumas de cuadrados como el error. La grafica de probabilidad normal de los efectos de los factores puede 
ser muy Util a este respecto. 


EJEMPLO 

Considere la situacidn descrita en el ejemplo 6-2. Recuerde que se estudian cuatro factores — la tempera- 
tura (A), la presidn ( B ), la concentration de formaldehido (C) y la velocidad de agitation (D) — en una 
planta piloto para determinar su efecto sobre el indice de filtration del producto. Se usar& este experi- 
mento para ilustrar las ideas de la formacidn de bloques y la confusion en un diseno no replicado. Se in- 
troduciran dos modificaciones al experimento original. Primera, suponga que no es posible correr las 
2 4 = 16 combinaciones de tratamientos utilizando un solo lote de materia prima. El experimentador 
puede correr ocho combinaciones de los tratamientos con un solo lote de material, por lo que un diseno 
2 4 confundido en dos bloques parece apropiado. Es logico confundir la interaccidn de orden mas alto 
ABCD con los bloques. La definition del contraste es 

L- x x +x 2 +x 2 +x 4 

y es sencillo verificar que el diseno es como el que se ilustra en la figura 7-4. De manera alternativa, puede 
examinarse la tabla 6-12 y observar que las combinaciones de los tratamientos que son + en la columna 
ABCD se asignan al bloque 1 y que las que son - en la columna ABCD , est&n en el bloque 2. 

La segunda modificacidn que se har& es introducir un efecto de los bloques para que pueda demos- 
trarse la utilidad de la formacidn de bloques. Suponga que cuando se seleccionan los dos lotes de materia 
prima que se necesitan para correr el experimento, uno de ellos es de calidad mucho m<is bajay, como re- 
sultado, todas las respuestas ser&n 20 unidades menores en este lote de material que en el otro, El lote de 
calidad menor se convierte en el bloque 1 y el lote de buena calidad se convierte en el bloque 2 (no es rele- 
vante a cu&l de los dos lotes se le llama bloque 1 o bloque 2). Entonces todas las pruebas del bloque 1 se 
realizan primero (las ocho corridas del bloque se hacen, desde luego, de manera aleatoria), pero las res- 
puestas son 20 unidades mas bajas que las que se habrian obtenido si se hubiera usado el material de bue- 
na calidad. En la figura lAb se muestran las respuestas resultantes; observe que 6stas se han encontrado 



• = Corridas an el bloque 1 
o - Corridas en el bloque 2 

a) Vista geometries 

Bloque 1 Bloque 2 

(1) = 25 
ab = 45 
ac = 40 
6c = 60 
ad = 80 

bd s= 25 
cd - 55 
abed - 76 

6) Asignaci6n de las 16 corridas 
en los dos bloques 

Figura 7-4 El diseno 2 4 en dos bloques para el ejemplo 7*2. 


a = 71 
6 = 48 
c - 68 
d=43 
abc - 65 
bed m 70 
acd b 86 
abd m 104 



A 


restando el efecto del bloque de las observaciones originates dadas en el ejemplo 6-2. Es decir, la respues- 
ta original de la combinacibn de tratamientos (1) fue 45, y en la figura 7-46 se consigna como (1) = 25 (= 
45 - 20). Las demds respuestas de este bloque se obtienen de manera similar. Despuds de que se realizan 
las pruebas del bloque 1, se prosigue con las ocho pruebas del bloque 2. No hay ningun problema con la 
materia prima de este lote, por lo que las respuestas son exactamente como fueron originalmente en el 
ejemplo 6-2. 

En la tabla 7-6 se muestran las estimaciones de los efectos para esta version “modificada” del ejemplo 
6-2. Observe que las estimaciones de los cuatro efectos principales, de las seis interacciones de dos facto- 
res y de las cuatro interacciones de tres factores son idbnticas a las estimaciones de los efectos obtenidas 
en el ejemplo 6-2, donde no hubo ningun efecto de bloques. Cuando se construye una grafica de probabili- 
dad normal de estas estimaciones de los efectos, los factores^, C,Dy las interacciones^4C y AD aparecen 
como los efectos importantes, justo como en el experimento original. (El lector debera verificar esto.) 

iQud puede decirse del efecto de la interaccibn ABCD1 La estimacibn de este efecto en el experi- 
mento original (ejemplo 6-2) fu eABCD = 1.375. En el presente ejemplo, la estimacion del efecto de la in- 
teraccibn ABCD es ABCD = -18.625. Puesto que^5C£» esta confundido con los bloques, la interaccion 
ABCD estima el efecto de la interaccidn original (1.375) m£s el efecto de bloque (-20), de donde ABCD ~ 
1.375 + (-20) = -18.625. (t, Puede el lector ver por qub el efecto del bloque es -20?) El efecto del bloque 
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Tabla 74> Estimaciones de los efectos para el disefto 2 4 separado en bloques del 
ejemplo 7-2 


T6rmino del 
modelo 

Coeficiente 
de regresidn 

Estimaci6n 
del efecto 

Suma de 
cuadrados 

Contribuci6n 

porcentual 

A 

10.81 

21.625 

1870.5625 

26.30 

B 

L56 

3.125 

39.0625 

0.55 

C 

4.94 

9.875 

390.0625 

5.49 

D 

7.31 

14.625 

855.5625 

12.03 

AH 

0.062 

0.125 

0.0625 

<0.01 

AC 

-9.06 

-18.125 

1314.0625 

18.48 

AD 

8.31 

16.625 

1105.5625 

15.55 

BC 

1.19 

2.375 

22.5625 

0.32 

BD 

-0.19 

-0.375 

0.5625 

<0.01 

CD 

-0.56 

-1.125 

5.0625 

0.07 

ABC 

0.94 

1.875 

14.0625 

0.20 

ABD 

2.06 

4.125 

68.0625 

0.96 

ACD 

-0.81 

-1.625 

10.5625 

0.15 

BCD 

-1.31 

-2.625 

27.5625 

0.39 

Bloques (ABCD) 


-18.625 

1387.5625 

19.51 


tambidn puede calcularse directamente como la diferencia en la respuesta promedio entre los dos blo- 
ques, o 


Efecto del bloque = , - y Bloque 2 

406 555 

‘8 8 

-149 


8 

= -18.625 


Desde luego, este efecto es en realidad la estimacidn de Bloques + ABCD. 

En la tabla 7-7 se resume el analisis de varianza de este experimento. Los efectos que tienen estima- 
ciones grandes estan incluidos en el modelo, y la suma de cuadrados de los bloques es 



(406) 2 +(555) 2 (961) 2 

8 16 


= 1387.5625 


labia 7-7 AnSlisis de varianza del ejemplo 7-2 


Fuente de 
variaci6n 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

Ft o 

Valor P 

Bloques (ABCD) 

1387.5625 

1 




A 

1870.5625 

1 

1870.5625 

89.76 

<0.0001 

c 

390.0625 

i 

390.0625 

18.72 

0.0019 

D 

855.5625 

i 

855.5625 

41.05 

0.0001 

AC 

1314.0625 

i 

1314.0625 

63.05 

<0.0001 

AD 

1105.5625 

i 

1105.5625 

53.05 

<0.0001 

Error 

187.5625 

9 

20.8403 



Tbtal 

7111.4375 

15 
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Las conclusiones de este experimento coinciden exactamente con las del ejemplo 6-2, donde no estuvo 
presente ningun efecto de bloques, Observe que si el experimento no se hubiera corrido en bloques, y si 
un efecto de magnitud -20 hubiera afectado los 8 primeros ensayos (los cuales se habrian seleccionado de 
manera aleatoria, ya que los 16 ensayos se habrian corrido en orden aleatorio en un diseno sin fonnacidn 
de bloques), los resultados pudieron haber sido muy diferentes. 


7<5 CONFUSION DEL DISENO FACTORIAL 2* EN CUATRO BLOQUES 

Es posible construir disenos factoriales 2 k confundidos en cuatro bloques con 2 k ~ 2 observaciones cada 
uno. Estos disenos son particularmente utiles en situaciones en las que el numero de factores es modera- 
damente grande, por ejemplo k > 4, y el tamano de los bloques es relativamente pequeno. 

Como un ejemplo, considere el diseno 2 5 , Si cada bloque incluira unicamente ocho corridas, entonces 
deberan usarse cuatro bloques. La construction de este diseno es relativamente directa, Se seleccionan 
dos efectos para confundirlos con los bloques, por ejemplo ADE y BCE. Estos efectos tienen las dos defi- 
niciones de contrastes 

L i = x 2 +x A +x 5 
L 2 = x 2 +x 5 

asociadas con ellos. Entonces cada combination de tratamientos producira un par particular de valores 
deL x (mod 2) y L 2 (mod 2), es dear, cualquiera de (L h L 2 ) = (0, 0), (0, 1), (1, 0) o bien (1, 1). Las combina- 
ciones de tratamientos que producen los mismos valores de (L 1? L 2 ) se asignan al mismo bloque. En el 
ejemplo tratado aqm se encuentra 

Lj = 0, L 2 = 0 para (1), ad, be, abed , abe , ace , ede , bde 

“ 1, L 2 = 0 para a, d, abc, bed , be, abde , ce, aede 

= 0, L 2 = 1 para b , abd , c , acd, ae, de, abce, bede 

1^ = 1, L 2 = 1 para e , ade , bee, abede, ab, bd, ac, cd 

Estas combinaciones de tratamientos se asignarian a bloques diferentes, En la figura 7-5 se muestra el di~ 
seno completo. 

Con un poco de reflexion, nos damos cuenta de que otro efecto adem&s de ADE y BCE debe confun- 
dirse con los bloques. Puesto que hay cuatro bloques con tres grados de libertad entre ellos, y puesto que 
ADE y BCE tienen un solo grado de libertad cada una, es evidente la necesidad de confundir un efecto 
adicional con un grado de libertad. Este efecto es la interaccion generalizada de ADE y BCE, la cual se 


Bloque 1 Bloque 2 Bloque 3 

1,-0 L , = 1 0 

L z - 0 L 2 - 0 L 2 = 1 

a be 
d abde 
abc ce 
bed aede 




Bloque 4 



= 1 

l 2 


e 

abode 

ade 

bd 

bee 

ac 

ab 

cd 


Figura 7-5 El diseno 2 5 en cuatro bloques con ADE , 
BCE y ABCD confundidos. 
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define como el producto fa ABE y BCE modulo 2* Por lo tanto, en el ejemplo tratado aqui la interaccidn 
generalizada ( ADE)(BCE ) = ABCDE 2 = ABCD tambi6n esta confundido con los bloques. Es sencillo ve- 
rificar esto refiri£ndose a la tabla de signos positivos y negativos del diseno 2 5 , como en Davies [36]. La 
inspection de esta tabla revela que las combinaciones de los tratamientos se asignan a los bloques de la si- 
guiente manera: 


Combinaciones de los 
tratamientos en el 

Signo dt ADE 

Signo de BCE 

Signo d tABCD 

Bloque 1 

- 

- 

+ 

Bloque 2 

+ 

- 

- 

Bloque 3 

“ 

+ 

- 

Bloque 4 

+ 

+ 

+ 


Observe que el producto de los signos de dos efectos cualesquiera de un bloque particular (por ejemplo 
ADE y BCE) produce el signo del otro efecto de ese bloque (en este caso, ABCD). Por lo tanto, ADE f 
BCE y ABCD est£n confundidos con los bloques. 

Las propiedades de la teoria de grupos del bloque principal mencionadas en la seccidn 7-4 siguen 
siendo v£lidas. Por ejemplo, se observa que el producto de dos combinaciones de tratamientos del bloque 
principal produce otro elemento del bloque principal. Es decir, 

ad - be = abed y abe * bde = ab 2 de 2 = ad 

etcetera. Para construir otro bloque se selecciona una combinacidn de tratamientos que no est6 en el blo- 
que principal (por ejemplo b)> y b se multiplica por todas las combinaciones de tratamientos del bloque 
principal. Se obtiene asf 

b-(l)=b b-ad = abd b-bc = b 2 c= c b*abcd = ab l cd — acd 

etcetera, lo que producir& las ocho combinaciones de tratamientos del bloque 3. En la pr£ctica, el bloque 
principal puede obtenerse a partir de la definition de contrastes y de la propiedad de la teoria de grupos, y 
los dem£s bloques pueden determinarse a partir de esta s combinaciones de los tratamientos aplicando el 
m£todo que se presento anteriormente. 

El procedimiento general para construir un diseno 2 k confundido en cuatro bloques consiste en elegir 
dos efectos para generar los bloques, confundi6ndose automaticamente un tercer efecto que es la interac- 
tion generalizada de las dos primeras. Despu^s se construye el diseno utilizando las dos definiciones de 
contrastes (L l9 L 2 ) y las propiedades de la teoria de grupos del bloque principal. A 1 seleccionar los efectos 
que van a confundirse con los bloques, debe tenerse cuidado de obtener un diseno en el que no estdn con- 
fundidos efectos que pueden ser de interns. Por ejemplo, en un diseno 2 5 podria elegirse confundir 
ABCDE y ABD, con lo cual se confunde automaticamente CE , un efecto que es de posible interns. Una 
mejor eleccidn es confundir ADE y BCE, con lo cual se confunde automaticamente AB CD. Es preferible 
sacrificar informacidn en las interacciones de tres factoresADE y BCE en lugar de la interaction de dos 
factores CE. 

7 '6 CONFUSlbN DEL DISENO FACTORIAL 2 k EN V BLOQUES 

Los mdtodos descritos antes pueden extenderse a la construccion de un diseno factorial 2 k confundido (o 
mezclado) en 2 P bloques (p < k), donde cada bloque contiene exactamente 2*^ corridas. Se seleccionan p 
efectos independientes que van a confundirse, donde por “independientes” se entiende que ninguno de 
los efectos elegidos es la interaccion generalizada de los dem4s. Los bloques pueden generarse mediante 


Tab la 7-8 Disposiciones de los bloques sugeridas para el diseno factorial 2 k 
Numero de Numero de Tamano del Efectos elegidos para 

factores ? k bloques, 2 p bloque, 2 k ~p generar los bloques Interacciones confundidas con los bloques 
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el uso de las p definiciones de contrastes L u L z , ..., L p asociadas con estos efectos. Asimismo, se confundi- 
rln otros 2 p -p-l efectos con los bloques, siendo 6stos las interacciones generalizadas de los p efectos in- 
dependientes elegidos inicialmente. Deberd tenerse cuidado al seleccionar los efectos que van a 
confundirse para que no se sacrifique informacidn sobre los efectos que pueden ser de interes potencial. 

El an&lisis estadfstico de estos disenos es directo. Las sumas de cuadrados de todos los efectos se 
calculan como si no se hubiera hecho la formacidn de bloques. Despuds, la suma de cuadrados de los blo- 
ques se encuentra sumando las sumas de cuadrados de todos los efectos confundidos con los bloques. 

Obviamente, la eleccidn de los p efectos usados para generar el bloque es critica, ya que la estructura 
de la confusidn (o mezclado) del diseno depende directamente de ellos. En la tabla 7-8 se presenta una 
lista de disenos utiles. Para ilustrar el uso de esta tabla, suponga que quiere construirse un diseno 2 6 con- 
fundido en 2 3 = 8 bloques con 2 3 = 8 corridas cada uno. La tabla 7-8 indica que se tltgaianABEF, ABCD 
y ACE como losp = 3 efectos independientes para generar los bloques. Los 2 P - p - 1 = 2 3 - 3-1 = 4 efec- 
tos restantes que est&n confundidos son las interacciones generalizadas de estos tres; es decir, 

(ABEF)(ABCD) - A 2 B 2 CDEF = CDEF 
(ABEF)(ACE) = A 2 BCE 2 F= BCF 
(ABCD)(ACE) = A 2 BC 2 ED= BDE 
(ABEF)(ABCD)(ACE) - A 3 B 2 C 2 DE 2 F= ADF 

En el problema 7-11 se le pide al lector que genere los ocho bloques de este diseno. 


7*7 CONFUSION PARCIAL 

En la seccidn 7-4 se subray6 que, a menos que los experimentadores cuenten con una estimation previa 
del error o que estdn dispuestos a suponer que ciertas interacciones son insignificantes, deben hacer re- 
plicas del diseno para obtener una estimacidn del error. En la figura 7-3 se muestra un diseno factorial 2 3 
en dos bloques con ABC confundido, con cuatro replicas. Por el analisis de varianza de este diseno, el cual 
se presenta en la tabla 7-5, se observa que no puede sacarse informacidn acerca de la interaccidn ABC de- 
bido a que ABC este confundido con los bloques en todos las replicas. Se dice que este diseno este comple- 
ta m ente confundido (o mezclado). 

Considere la altemativa que se presenta en la figura 7-6. De nueva cuenta hay cuatro rdplicas del di- 
seno 2 3 , pero en cada rdplica se ha confundido una interaccidn diferente. Es decir, ABC este confundido en 
la rdplica I, AB este confundido en la rdplica II, BC este confundido en la replica III yAC este confundido 
en la rdplica IV. Como resultado puede obtenerse informacidn d eABC a partir de los datos de las rdplicas 
II, III y IV; informacidn dt AB puede obtenerse de las rdplicas I, III y IV; informacidn dev4C puede obte- 


R6plica I R6piica n 

ABC Confundido AB Confundido 


(1) 


a 


(1) 


a 

ab 


b 


c 


b 

ac 


c 


ab 


ac 

be 


abc 


abc 


be 


Replica U1 Replica IV 

BC Confundido AC Confundido 


(1) 


b 


(1) 


a 

a 


c 


b 


c 

be 


ab 


ac 


ab 

abc 


ac 


abc 


be 


Figura 7-6 Confusidn parcial en el diseno 2 3 . 
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labia 7-9 AnAlisis de varianza de un disefio 2 3 parcialmente confundido 

Grados de 


Fuente de variacidn libertad 

Replicas 3 

Bloques dentro de replicas [oABC (r6p. I) + AB (rep. II) 

+ BC (r6p. ni) + AC (rip. IV)] 4 

A 1 

B 1 

C 1 

AB (de las replicas I, III y IV) 1 

AC (de las replicas I, II y III) 1 

BC (de las replicas I, II y IV) 1 

ABC (de las replicas I, III y IV) 1 

Error 17 

Tbtal 31 


nerse de las replicas I, II y III; e informacidn de BC puede obtenerse de las replicas I, II y IV. Se dice que 
pueden obtenerse tres cuartas partes de la informacion de las interacciones porque no estfin confundidas 
en sblo tres riplicas. Yates [113b] llama a la relation 3/4 la informacidn relativa de los efectos confundi- 
dos. Se dice que este diseno est& parcialmente confundido (o mezclado). 

En la tabla 7-9 se muestra el analisis de varianza de este diseno. Para calcular las sumas de cuadrados 
de las interacciones, s61o se usan los datos de las replicas en las que no est& confundida una interaccibn. 
La suma de cuadrados del error consta de las sumas de cuadrados de replicas x sumas de cuadrados de 
efecto principal, mbs las sumas de cuadrados de replicas x sumas de cuadrados de interaccion para cada 
replica en la que esa interaccion no estb confundida (por ejemplo, replicas x ABC para las replicas II, III 
y IV). Adembs, hay siete grados de libertad entre los ocho bloques. Es comtin hacer la particibn de tres 
grados de libertad para las replicas y cuatro grados de libertad para los bloques dentro de las replicas. La 
composicibn de la suma de cuadrados de los bloques se muestra en la tabla 7-9 y se sigue directamente de 
la elecci6n del efecto confundido en cada replica. 

EJEMPLO 7-3 

Un diseno 2 3 con confusidn parcial 

Considere el ejemplo 6-1, en el que se realizb un estudio para determinar el efecto del porcentaje de car- 
bonatacibn (A), la presibn de operacibn (B) y la velocidad de lrnea ( C ) sobre la altura de llenado de una 
bebida carbonatada. Suponga que cada lote de jarabe alcanza s61o para probar cuatro combinaciones de 
tratamientos. Por lo tanto, cada riplica del diseno 2 3 debe correrse en dos bloques. Se corren dos replicas, 
con ABC confundido en la replica I y AB confundido en la replica II. Los datos son los siguientes: 


Replica I 
ABC confundido 


(1) = -3 


a = 0 

ab = 2 


b = -1 

ac ~ 2 


c — 1 

be = 1 


abc — 6 


Replica II 
AB confundido 


(i) = -i 


a = 1 

c = 0 



ab = 3 


ac - 1 

abc = 5 


be — 1 
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Tabla 7*10 AnSlisis de varianza del ejemplo 7-3 


Fuente de 
variation 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

F o 

Valor P 

ROplicas 

1.00 

1 

too 

- 


Bloques dentro de las replicas 

2.50 

2 

1.25 

- 


A 

36.00 

1 

36.00 

48.00 

0.0001 

B 

20.25 

1 

20.25 

27.00 

0.0035 

C 

12.25 

1 

12.25 

16.33 

0.0099 

AB (sOlo en la replica I) 

0.50 

1 

0.50 

0.67 

0.4503 

AC 

0.25 

1 

0.25 

0.33 

0.5905 

BC 

1.00 

1 

1.00 

1.33 

0.3009 

ABC (sOlo en la replica II) 

0.50 

1 

0.50 

0.67 

0.4503 

Error 

3.75 

5 

0.75 

- 


TbtaJ 

78.00 

15 

- 

- 



Las sumas de cuadrados deA, B, C, AC y BC pueden calcularse de la manera usual, utilizando las 16 
observaciones. Sin embargo, SS ABC debe encontrarse utilizando unicamente los datos de la replica II y 
SS AB utilizando unicamente los datos de la replica I de la siguiente manera: 

_[a+b+c+abc-ab—ac—bc—( l)] 2 
MC ~ n2 k 

| l + 0 + 0 + 5 - 3 - l - l -(- l )] 2 

(1)(8) 

_ [(1 )+a6c-ac+c-fl-fe+afe-frc] 2 
M ~ nl k 

j _ 3 + 6 . 2 +(- 1 )- 0 -(- 1 )+ 2 - 1] 2 „ 050 

( 1 )( 8 ) 


La suma de cuadrados de las replicas es, en general, 


SS 


Rep 



( 6) 2 +( 10) 2 ( 16) 2 
8 16 


too 


dondeii* es el total de las observaciones en la replica h-6 sima, La suma de cuadrados de los bloques es la 
suma de SS^c de la r6plica I y 55 ^ de la r6plica II, o SS Eloqucs - 2.50. 

En la tabla 7-10 se resume el analisis de varianza. Los tres efectos principales son importantes. 


7*8 PROBLEMAS 

7-1. Considere el experimento descrito en el problema 6-1, Analizar este experimento suponiendo que cada re- 
plica representa un bloque de un solo turno de produccidn. 

7-2, Considere el experimento descrito en el problema 6-5. Analizar este experimento suponiendo que cada una 
de las cuatro replicas representa un bloque. 

7-3 . Considere el experimento de la formation de fisuras en la aleacidn de niquel y titanio descrito en el problema 
6-15. Suponga que s61o pudieron hacerse 16 corridas en un solo dia, por lo que cada replica se tratd como un 
bloque. Analizar el experimento y sacar conclusiones. 
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7-4. Considere los datos de la primera replica del problems 6-1. Suponga que no fue posible correr todas estas ob- 
servaciones utilizando barras del mismo lote. Establecer un diseno para correr estas observaciones en dos 
bloques de cuatro observaciones cada uno con ABC confundido. Analizar los datos. 

7-5, Considere los datos de la primera rdplica del problems 6-7. Construir un diseno con dos bloques de ocho ob- 
servaciones cada uno con ABCD confundido. Analizar los datos. 

7-6. Repetir el problems 7-5 suponiendo que se requieren cuatro bloques. Confundir ABD y ABC (y por consi- 
guiente CD) con los bloques. 

7-7, Utilizando los datos del diseno 2 5 del problems 6-21, construir y analizar un diseiio en dos bloques con 
ABODE confundido con los bloques. 

7-8. Repetir el problems 7-7 suponiendo que se necesitan cuatro bloques. Sugerir un esquema de confusidn (o 
mezclado) razonable, 

7-9. Considere los datos del diseiio 2 s del problema 6-21 , Suponga que fue necesario correr este diseiio en cuatro 
bloques con ACDE y BCD (y por consiguiente ABE) confundidos. Analizar los datos de este diseno. 

7-10. Disenar un experimento para confundir un diseno factorial 2 6 en cuatro bloques, Sugerir un esquema de con- 
fusidn apropiado, diferente del que se ilustrd en la tabla 7-8. 

7-11, Considere el diseno 2 6 en ocho bloques con ocho corridas cada uno con ABCD, ACE y ABEF como los efec- 
tos independientes elegidos para confundirlos con los bloques. Generar el diseiio. Encontrar los dem&s efec- 
tos confundidos con los bloques. 

7*12. Considere el diseiio 2 2 en dos bloques con AB confundido. Hacer la demostracidn algebraica de que SS^ = 

^Bloques- 

7-13, Considere los datos del ejemplo 7-2. Suponga que todas las observaciones del bloque 2 se incrementan en 20, 
Analizar los datos que resultarian. Estimar el efecto de bloque. £Puede el lector explicar su magnitud? LLos 
bloques parecen ser ahora un factor importante? 6Hay otras estimaciones de los efectos que sufran el impac- 
to de este cambio hecho en los datos? 

7-14. Suponga que en el problema 6-1 se confundid ABC en la rdplica I ,AB en la rdplica IlyBC en la replica III. 
Calcular las estimaciones de los efectos. Construir la tabla del an&lisis de varianza. 

7-15. Repetir el problema 6-1 suponiendo que ABC se confundid con los bloques en todas las rdplicas. 

7-16. Suponga que en el problema 6-7 ABCD se confundid en la rdplica I y ABC se confundid en la rdplica II. Reali- 
zar el andlisis estadfstico de este diseiio. 

7-17. Construir un diseno 2 3 con ABC confundido en las dos primeras rdplicas y BC confundido en la tercera rdpli- 
ca. Delinear el an£lisis de varianza y comentar la informacidn obtenida. 
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Cuando el numero de factores de un diseno factorial 2 k se incrementa, el numero de corridas necesarias 
para realizar una replica completa del diseno rebasa con rapidez los recursos de la mayoria de los expert- 
mentadores. Por ejemplo, una r6plica completa de un diseno 2 6 requiere 64 corridas. En este diseno, s61o 
6 de los 63 grados de libertad corresponden a los efectos principales, y s61o 15 a las interacciones de dos 
factores. Los 42 grados de libertad restantes se asocian con las interacciones de tres o m&s factores. 

Si el experimentador puede suponer razonablemente que ciertas interacciones de orden superior son 
insignibcantes, es posible obtener informacidn de los efectos principales y las interacciones de orden infe- 
rior corriendo unicamente una fraccidn del experimento factorial completo, Estos disenos factoriales 
fraccionados se encuentran entre los tipos de disenos de uso mas generalizado en el diseno de productos y 
procesos y en el mejoramiento de procesos. 

Una de las principales aplicaciones de los disenos factoriales fraccionados es en los experimentos de 
tamizado o exploration. Se trata de experimentos en los que se consideran muchos factores y el objetivo 
es identificar aquellos factores (en caso de haberlos) que tienen efectos grandes. Los experimentos de ta- 
mizado suelen realizarse en las etapas iniciales de un proyecto, cuando es posible que muchos de los fac- 
tores considerados en un principio tengan un efecto reducido o nulo sobre la respuesta. Entonces los 
factores que se identifican como importantes se investigan con mayor detalle en experimentos subsecuentes. 

El uso exitoso de los disenos factoriales fraccionados se basa en tres ideas clave: 

1* El principio de efectos esparcidos o escasez de efectos . Cuando hay varias variables, es posible que el 
sistema o proceso est£ dominado principalmente por algunos de los efectos principales y las in- 
teracciones de orden inferior. 

2. La propiedad de proyeccion, Los disenos factoriales fraccionados pueden proyectarse en disenos 
m&s fuertes (m &$ grandes) en el subconjunto de los factores significativos. 

3. Experimentacidn sequential Es posible combinar las corridas de dos (o m£s) disenos factoriales 
fraccionados para ensamblar secuencialmente un diseno m&s grande para estimar los efectos de 
los factores y las interacciones de interns. 


303 



304 CAPflULO 8 DISENOS FACTORIALES FRACCIONADOS DE DOS NIVELES 

Este capftulo se enfoca en estos principios, los cuales se ilustran con varios ejemplos. 

8-2 LA FRACCION UN MEDIO DEL DISENO 2 k 

Considere una situacidn en la que tres factores, cada uno con dos niveles, son de interes, pero los experi- 
mentadores no esttin en posici6n de correr las 2 3 = 8 combinaciones de tratamientos. Sin embargo, pue- 
den llevar a cabo cuatro corridas. Esto sugiere una fraccidn un medio de un diseno 2 3 . Puesto que el 
diseno contiene 2 3 " 1 = 4 combinaciones de tratamientos, es comun llamar diseAo 2 3_1 a una fraccion un 
medio del diseno 2 3 . 

En la tabla 8-1 se muestra la agrupacidn de signos positivos y negativos del diseno 2 3 . Suponga que se 
seleccionan las cuatro combinaciones de tratamientos a, b, c y abc como la fracci6n un medio con la que se 
trabajarf. Estas corridas se muestran en la parte superior de la tabla 8-1 y en la figura 8-la. 

Observe que el diseno 2 3 " 1 se forma seleccionando s61o las combinaciones de tratamientos que tienen 
signo positivo en la columna^BC. Por lo tanto, a ABC se le llama el generador de esta fraccidn particular. 
En ocasiones se hara referenda a un generador, por ejemploABC, como una palabra. Ademas, la colum- 
na identidad 7 tambi6n es siempre positiva, por lo que a 

7= ABC 

se le llama la relaci6n de definicidn del diseno. En general, la relacidn de definicidn de un diseno factorial 
fraccionado ser A siempre el conjunto de todas las columnas que son iguales a la columna identidad 7 . 

Las combinadones de tratamientos del disefto 2 V1 producen tres grados de libertad que pueden usar- 
se para estimar los efectos prindpales. Con referencia a la tabla 8-1, se observa que las combinaciones li- 
neales de las observaciones usadas para estimar los efectos prindpales de A, B y C son 

= %(a-b-c+abc) 

£ b - %(-a+b-c+abc) 
i c s\(-a~b+c+abc) 

Tkmbien es sencillo verificar que las combinaciones lineales de las observaciones usadas para estimar las 
interacdones de dos factores son 

t BC =i(a-b-c+flbc) 

*ac =H- a + b ~ c+abc ) 

^AB=H- a ~ b+c+abc ) 


Tabla 8-1 Signos positivos y negativos del disefto factorial 2 3 


Combinaci6n de 

tratamientos I A 


a 

+ 

+ 

b 

+ 

- 

C 

+ 

- 

abc 

+ 

+ 

ab 

+ 

+ 

ac 

+ 

+ 

be 

+ 

- 

(1) 

+ 

- 


B_ 

+ 

+ 

+ 


Efecto factorial 
C AB 


+ + 

+ + 

~ + 

+ 

+ 

+ 


AC BC ABC 

+ + 

+ + 

- + 

+ + + 


+ 

+ 

+ + 
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be 



( 1 ) 

b ) U fracci6n alterna, / - -ABC 

Figura 8-1 Las dos fracciones un medio del di- 
seno 2 3 . 


Por lo tanto, l A = t BC , l B = i AC y t c = por consiguiente, es imposible diferenciar entre .4 y BC, entre B y 
AC y entre C y AB. De hecho, cuando se estimanv4, B y C, se est&n estimando en realidad A + BC, B + AC 
y C + AB. A dos o mds efectos que tienen esta propiedad se les Hama alias. En el ejemplo tratado aqui,A y 
BC son alias, B yAC son alias y C yAB son alias. Esto se indica con la notation £ A -*A + BC,t B -*B +ACy 
t c -* C + AB. 

La estructura de los alias para este diseno puede determinarse con facilidad utilizando la rclacion de 
definici6n/ —ABC. A1 multiplicar cualquier columna (o efecto) por la relacion de definici6n se obtienen 
los alias de esa colu m na (o efecto). En el ejemplo tratado aquf se encuentra que el alias de A es 

AJ=AABC= A 2 BC 

o, puesto que el cuadrado de cualquier columna es la identidad /, 


A= BC 

De manera similar, se encuentra que los alias de B y C son 

B- 1 = B- ABC 

B- AB 2 C = AC 


y 

C-I= C-ABC 
C= ABC 2 = AB 

A esta fraction un medio, con I = +ABC, suele llam£rsele la fraction principal. 

Suponga ahora que se eligid la otra fraccidn un medio, es decir, las combinaciones de tratamientos de 
la tabla 8-1 asociadas con los signos negativos de la columnaAfiC. Esta fraccidn un medio alterna o com- 
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plementaria (la cual se compone de las corridas (1), ab, ac y be) se ilustra en la figura 8-lb. La relation de 
definition de este disefio es 

I =- ABC 

De la combination lineal de las observaciones, por ejemplo t' A , l' B y I' c , de la fraction alterna se obtiene 

l' A -+A-BC 
e' B B- AC 
t'c -+C-AB 

Por lo tanto, cuando se estiman A, By C con esta fraccion particular, en realidad se est&n estimando 
A-BC, B-AC y C-AB. 

En la prdctica, no importa cudl de las fracciones se usa. Ambas fracciones pertenecen a la misma fa- 
milia; es decir, las dos fracciones un medio fonnan un diseno 2 3 completo. Esto puede observarse con fa- 
cilidad con referenda a los incisos a y b de la figura 8-1. 

Suponga que despues de correr una de las fracciones un medio del diseno 2 3 , tambien se corrid la 
otra. Por lo tanto, se cuenta ahora con las ocho corridas asociadas con el diseno 2 3 completo. Pueden ob- 
tenerse entonces las estimaciones sin alias de todos los efectos analizando las ocho corridas como un dise- 
no 2 3 completo en dos bloques de cuatro corridas cada uno. Esto tambibn podrfa hacerse sumando y 
restando la combinacidn lineal de los efectos de las dos fracciones individuates. Por ejemplo, considere 
t A ■* A + BC y i' A -* A - BC. Esto implica que 

k(l A +t' A )=HA+BC+A-BC) + A 

y que 

2^a-^a)= \{A+BC-A+BC)^BC 

Por lo tanto, para los tres pares de combinaciones lineales se obtendria lo siguiente: 


i 

DeiiC + V) 


A 

A 

BC 

B 

B 

AC 

C 

C 

AB 


Resolucidn del diseno 

A1 diseno 2 3-1 precedente se le llama diseno de resolution III. En este diseno, los efectos principales son 
alias de las interacciones de dos factores. Un disefio es de resolution R cuando ningun efecto del factory 
es alias de otro efecto que contiene menos de R -p factores. Por lo general se emplea un subindice con un 
numeral romano para denotar la resolution del diseno; por lo tanto, la fraccion un medio del diseno 2 3 
con la relation de definitidn I = ABC (o I = -ABC) es un diseno 2 3 ^ 1 . 

Los disefios de resolucidn III, IV y V son particularmente importantes. A continuacibn se presentan 
las definiciones de estos disenos y un ejemplo de cada uno: 

1. Disenos de resolucidn III. Se trata de disenos en los que ninguno de los efectos principales es alias 
de ningun otro efecto principal, pero los efectos principales son alias de las interacciones de dos 
factores, y algunas de las interacciones de dos factores pueden ser alias entre si. El diseno 2 3 " 1 de 
la tabla 8-1 es un disefio de resolucidn III (2^*). 

2. Disenos de resolucidn IV. Se trata de disefios en los que ninguno de los efectos principales es alias 
de ningfin otro efecto principal ni de las interacciones de dos factores, pero las interacciones de 
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dos factores son alias entre si. Un diseno 2 4-1 con I = ABCD es un diseno de resolucion IV 

Vp 1 )- 

3. Disenos de resolucion V. Se trata de disenos en los que ninguno de los efectos principales ni de las 
interacciones de dos factores son alias de otro efecto principal o interaction de dos factores, pero 
las interacciones de dos factores son alias de las interacciones de tres factores. Un diseno 2 5 " 1 con 
I = ABCDE es un diseno de resolucion V (2^'). 

En general, la resolucion de un diseno factorial fraccionado de dos niveles es igual al menor numero 
de letras en cualquier palabra de la relacidn de definition. Por consiguiente, los disenos precedentes po- 
drian denominarse disenos de tres, cuatro y cinco letras, respectivamente. Por lo comun, es preferible era- 
plear disenos fraccionados que tengan la resolucidn mas alta posible que sea consistente con el grado de 
fraccionamiento requerido. Entre mas alta sea la resolucion, menos restrictivos scran los supuestos que 
se requieren respecto de curies de las interacciones son insignificantes para obtener una interpretation 
unica de los datos. 

Construction de fracciones un medio 

Una fracci6n un medio del diseno 2 k de la resolucion mis alta puede construirse apuntando el diseno bi- 
sico, que consta de las corridas de un diseno factorial 2 k ' complete, y agregandole despues el factor A-esi- 
mo identificando sus niveles positivo y negativo con los signos positivo y negativo de la interaction ABC — 
(K- 1) del orden mis alto. Por lo tanto, el diseno factorial fraccionado 2„j 1 se obtiene apuntando el dise- 
no 2 2 complete como diseno bisico e igualando despu6s el factor C con la interaction AB. La fraccidn al- 
tema se obtendria igualando el factor C con la interaccidn -AB. Este enfoque se ilustra en la tabla 8-2, 
Observe que el diseno basico siempre tiene el numero correcto de corridas (renglones), pero le falta una 
columna. El generador/ =ABC —K se resuelve entonces para la columna faltante (K), de tal modo que K 
= ABC — (K- 1) define el producto de los signos positivos y negativos que deberi usarse en cada rengldn 
para producir los niveles del factor it-isimo. 

Observe que podria usarse cualquier efecto de interaction para generar la columna del factor A>6si- 
mo. Sin embargo, al utilizarse cualquier efecto que no sea ABC - (K- 1), no se produciri el diseno con la 
resolution mis alta posible. 

Otra forma de visualizar la construction de una fraction un medio es mediante la partition de las co- 
rridas en dos bloques con la interaction de orden mis alto ABC — K confundida. Cada bloque es un dise- 
fio factorial fraccionado 2*" 1 con la resoluciOn mis alta. 

ProyecciOn de fracciones en disenos factoriales 

Cualquier diseno factorial fraccionado de resoluciOn R contiene disenos factoriales completos (posible- 
mente disenos factoriales con rOplicas) en cualquier subconjunto de R - 1 factores. Este es un concepto 
importante y util. Por ejemplo, si un experimentador tiene varios factores de interes potencial pero piensa 


Tabla 8-2 Las dos fracciones un medio del disefio V 



Disefio factorial 

2 2 complcto 
(diseno 
b&sico) 


2%, I = ABC 

2 3 ^ 1 = 
^iii > 1 

-ABC 

Corrida 

A B 

A 

B C — AB 

A B 

C = -AB 


1 - + 
2 + - + - - 

3 - + - + 

4 + + + + + 
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Figure 8-2 Proyecd6n de un diseno 
2’,, 1 en tres disenos 2 2 . 


que s61o R ~ 1 de ellos tienen efectos importantes, entonces un diseno factorial fraccionado de resolucidn 
R es la elecddn de diseno apropiada. Si el experimentador esta en lo correcto, el diseno factorial fraccio- 
nado de resolucidn R se proyectar£ en un diseno factorial completo en los R - 1 factores significativos. 
Este proceso se ilustra en la figura 8-2 para el diseno 2^ , el cual se proyecta en un diseno 2 2 en cada sub- 
conjunto de dos factores. 

Puesto que la mireima resolucidn posible de una fraccidn un medio del diseno 2 fc es R = k, todos los di- 
senos 2 A 1 se proyectaran en un factorial completo en (k - 1) cualquiera de los k factores originales. Adcmiis, 
un diseno 2 kl puede proyectarse en dos replicas de un factorial completo en cualquier subconjunto dek-2 
factores, cuatro rdplicas de un factorial completo en cualquier subconjunto dek-3 factores, etc6tera. 

EJEMPLO 8-1 

Considere el experimento del indice de filtracion del ejemplo 6-2. El diseno original, ilustrado en la tabla 
6-10, es una sola replica del diseno 2 4 . En ese ejemplo se encontrd que los efectos principales dcA, CyDy 
las interacciones y4C y AD eran diferentes de cero. Se retoma ahora este experimento y se Simula lo que 
habria ocurrido si se hubiera corrido una fraction un medio del diseno 2 4 en vez del diseno factorial com- 
pleto. 

Se usard el diseno 2 4 " 1 con / = ABCD, ya que esta election del generador dara como resultado un di- 
seno con la resoluci6n m&s alta posible (IV). Para construir el diseno, primero se apunta el diseno basico, 
el cual es un diseno 2 3 , como se muestra en las tres primeras columnas de la tabla 8-3. Este diseno b&sico 
tiene el numero necesario de corridas (ocho) pero s61o tres columnas (factores). Para encontrar los nive- 
les del cuarto factor, se resuelve/ = ABCD paraD, oD =ABC. Por lo tanto, el nivel dc D de cada corrida 


Tabla 8-3 El disefio 2^, 1 con la relaci6n de definici6n I— ABCD 


Corrida 

A 

Diseno basico 

B 

C 

D=ABC 

Combinacidn de 
txatamientos 

Indice de 
filtracidn 

1 

_ 


_ 

- 

(i) 

45 

2 

+ 

_ 

— 

+ 

ad 

100 

3 




+ 

bd 

45 

4 

+ 

+ 

- 

- 

ab 

65 

5 

_ 

_ . 

+ 

+ 

cd 

75 

6 

+ 

_ 

+ 

- 

ac 

60 

7 



+ 

+ 

- 

be 

80 

8 

+ 

+ 

+ 

+ 

abed 

96 
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D 


bc = 80 I" 



abed = 96 




A 


Figure $-3 El disefio 2^ para el experimento del Indice de filtracidn del ejemplo 8-1. 


es el producto de los signos positivos y negativos de las columnasA, B y C. El proceso se ilustra en la tabla 
8-3. Puesto que el generador ABCZ) es positivo, este diseno 2 es la fraccibn principal. El diseno se ilus- 
tra graficamente en la figura 8-3. 

Utilizando la relacibn de definicibn, se observa que cada uno de los efectos prineipales es alias de una 
interaccibn de tres factores; esdecir,A =A 2 BCD ~BCD,B -AB 2 CD =ACD,C =ABC 2 D =ABDyD = 
ABCD 2 - ABC . Ademds, cada interaccibn de dos factores es alias de otra interaccibn de dos factores. 
Estas relaciones de los alias son AB = CD, AC = BD y BC = AD, Los cuatro efectos prineipales mis los 
tres pares de alias de interacciones de dos factores representan los siete grados de libertad del diseno. 

En este punto, normalmente se aleatorizarian las ocho corridas y se llevarfa a cabo el experimento. 
Puesto que se ha corrido ya el diseno 2 4 completo, simplemente se seleccionan los ocho indices de filtra- 
cibn observados del ejemplo 6-2 que corresponden a las corridas del diseno Estas observaciones se 
muestran en la tiltima columna de la tabla 8-3, asi como en la figura 8-3. 

En la tabla 8-4 se muestran las estimaciones de los efectos obtenidas de este diseno 2^\ Para ilustrar 
los cllculos, la combinacibn lineal de las observaciones asociadas con el efecto de A es 

i A =i(-45+100- 45+65- 75+60- 80 + 96)= 19.00^ A+BCD 

mientras que para el efecto AB se obtendria 

£ab =t(45- 100 - 45+ 65+ 75- 60- 80+ 96) = -1.00-* AB+CD 

Por la inspeccibn de la informacibn de la tabla 8-4, no es irrazonable concluir que los efectos prineipales 
deA, CyD son grandes. Adem£s, si A, Cy D son los efectos prineipales importantes, entonces es lbgico 
concluir que las dos cadenas de alias de interaccionesAC + BD y AD + BC tienen efectos grandes, ya que 


Tabla 8-4 Estimaciones de los efectos 
y los alias del ejemplo 8d fl 

Estimacibn Estructura de los alias 


t A 

- 

19.00 

l A -* A 4- BCD 


— 

1.50 

£ B -*■ B+ ACD 

l c 

= 

14.00 

t c -+ C + ABD 


3S 

16.50 

t D -* D+ ABC 

£ AB 


-1.00 

£ jib AB + CD 

£ AC 

— 

-18.50 

£ AC -* AC + BD 

£ AD 

= 

19.00 

*ad -*AD+BC 


"Los efectos significativos se indican en negritas. 
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75 96 



Figura 8-4 Proyeccidn del diserio 2 Jy 1 en un diseno 2 3 en^ C 
y D para el ejemplo 8-1. 


las interacciones^lCyAD tambien son significativas. En otras palabras, si A, CyD son significativos, en- 
tonces lo mas posible es que las interacciones significativas sean^lC y AD. Se trata de una aplicacidn de la 
navaja de Ockham (en honor de Guillermo de Ockham), un principio cientifico que establece que cuan- 
do uno se confronta con varias interpretaciones posibles de un fendmeno, la interpretacidn m&s simple 
suele ser la correcta. Observe que esta interpretacidn concuerda con las conclusiones del an£lisis del dise- 
no 2 4 completo del ejemplo 6-2. 

Puesto que el factor B no es significativo, puede sacarse de consideracidn. Por consiguiente, este dise- 
no 2^ puede proyectarse en una sola rdplica del diseno 2 3 en los factores^l, C y D, como se muestra en la 
figura 8-4. El examen visual de esta gr&fica de cubo nos hace sentimos m£s cdmodos con las conclusiones 
a las que se llegd antes. Observe que si la temperatura (^4) esta en el nivel bajo, la concentracidn (C) tiene 
un efecto positivo grande, mientras que si la temperatura esta en el nivel alto, la concentracidn tiene un 
efecto muy pequeno. Esto se debe probablemente a una interaccidn^lC. Ademas, si la temperatura est£ 
en el nivel bajo, el efecto de la velocidad de agitacidn ( D ) es insignificante, mientras que si la temperatura 
esta en el nivel alto, la velocidad de agitacidn tiene un efecto positivo grande, Esto se debe probablemente 
a la interaccidn AD que se identified de manera tentativa unos p£rrafos antes. 

Con base en el an&lisis anterior, puede obtenerse ahora un modelo para predecir el indice de filtra- 
cidn en la regidn experimental. Este modelo es 

9 = K "*"^ 1^1 "^^ 3^3 "*"/^ 13 ^ 1*3 


dondejtu^y^ son variables codificadas (-1 <x L <^ +l)querepresentanayf, CyZ),ylas/?soncoeficien- 
tes de regresidn que pueden obtenerse a partir de las estimaciones de los efectos como se hizo anterior- 
mente. Por lo tanto, la ecuacidn de prediccidn es 



Recuerde que la ordenada al origen /? 0 es el promedio de todas las respuestas en las ocho corridas del di- 
seho. Este modelo es muy similar al que resulto del diseno factorial 2 k completo del ejemplo 6-2. 
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EJEMPLO 8-2 

Un diseno 2 5 - 1 usado para mejorar un proceso 

Se investigaron cinco factores en un proceso de manufactura de un circuito integrado en un diseno 2 3 " 1 
con el objetivo de mejorar el rendumento del proceso. Los cinco factores fueron A = ajuste de apertura 
(pequena, grande), B = tiempo de expositidn (20% abajo del nominal, 20% arriba del nominal), C = 
tiempo de desarrollo (30 s, 45 s ),D = tamano de la mdscara (pequena, grande) yE = tiempo de grabado 
(14.5 min, 15.5 min). En la tabla 8-5 se muestra la construccidn del diseno 2 5 ~ 1 . Observe que el diseno se 
construy6 apuntando el diseno bdsico que tiene 16 corridas (un diseno 2 4 enA, B, CyD), seleccionando 
ABCDE como generador, y ajustando despu6s los niveles del quinto factor E = ABCD. En la figura 8-5 se 
presenta una representation geometrica del diseno. 

La relation de definition del diseno es I = ABCDE. Por consiguiente, todos los efectos principales 
son alias de una interaction de cuatro factores (por ejemplo, i A -*A + BCDE ), y cada una de las interac- 
ciones de dos factores son alias de una interacciOn de tres factores (por ejemplo, t M -*AB + CDE). Por lo 
tanto, el diseno es de resolution V. Se esperaria que este diseno 2 5-1 proporcionara excelente informaci6n 
respecto de los efectos principales y las interacciones de dos factores. 

La tabla 8-6 contiene las estimaciones de los efectos, las sumas de cuadrados y los coeficientes del 
modelo de regresiOn para los 15 efectos de este experimento. En la figura 8-6 se presenta la gr&fica de 
probabilidad normal de las estimaciones de los efectos de este experimento. Los efectos principales de A, 
B y Cy la interacciOnAB son grandes. Recuerde que, debido a los alias, estos efectos son en realidad A + 
BCDE, B +ACDE, C +ABDE y AB + CDE. Sin embargo, puesto que parece plausible que las interac- 
ciones de tres factores y de Ordenes superiores sean insignificantes, uno siente seguridad en concluir que 
sOlo A, B, C y AB son los efectos importantes. 

En la tabla 8-7 se resume el analisis de varianza de este experimento. La suma de cuadrados del 
modelo es SS ModeU> = SS A + SS B + SS C + SS AB = 5747.25, y esto explica m&s de 99% de la variabilidad 
total del rendimiento. En la figura 8-7 se presenta la grafica de probabilidad normal de los residuales 


Tabla 8-5 Un disefto 2 5-1 para el ejemplo 8-2 


Diseno Msico 


Corrida 

A 

B 

C 

1 

2 

+ 

- 

- 

3 

- 

+ 

— 

4 

+ 

+ 

- 

5 

- 

- 

+ 

6 

+ 

- 

+ 

7 

- 

+ 


8 

+ 

+ 

+ 

9 

— 

_ 



10 

+ 

_ 

_ 

11 

- 

+ ■ 

_ 

12 

+ 

+ 

_ 

13 

- 

_ 

+ 

14 

+ 

_ 

+ 

15 

- 

+ 

+ 

16 

+ 

+ 

+ 


D 


+ 

+ 

+ 

+ 

+ 

+ 

+ 

+ 


Combinaci6n de 

E = ABCD tratamientos 


+ 

e 

- 

a 

- 

b 

+ 

abe 

- 

c 

+ 

ace 

+ 

bee 

- 

abc 

- 

d 

+ 

ade 

+ 

bde 

- 

abd 

+ 

ede 

- 

acd 

- 

bed 

+ 

abede 


Rendimiento 

9 

34 

52 

16 

22 

45 

60 

6 

10 

30 

50 

15 

21 

44 

63 
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D 



Figura 8-5 El diseno 2y 1 del ejemplo 8-2. 









Figure 8-6 Gr&fica de probabilidad normal de los efectos del ejemplo 8-2. 


Tabla 8-7 An£Iisis de varianza del ejemplo 8-2 


Fuente de variaci6n 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

F o 

Valor P 

A (Apertura) 

495.0625 

1 

495.0625 

193.20 

<0.0001 

B (Tiempo de exposicidn) 

4590.0625 

1 

4590.0625 

1791.24 

<0.0001 

C (Tiempo de desarrollo) 

473.0625 

1 

473.0625 

184.61 

<0.0001 

AB 

189,0625 

1 

189.0625 

73.78 

<0.0001 

Error 

28.1875 

11 

2,5625 



Tbtal 

5775.4375 

15 
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Figure 8-7 Gr£fica de probabilidad normal de los residuales del ejemplo 8-2. 
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10 20 30 40 50 60 

Rendimiento predlcho 


Figura 8-8 Gr£fica de los residuales contra el rendimiento predicho 
para el ejemplo 8-2. 

y la figura 8-8 es una grSfica de los residuales contra los valores predichos. Ambas gr&ficas son satis- 
factorias. 

Los tres factores A, B y C tienen efectos positivos grandes. La interaccidn apertura-tiempo de exposi- 
ci6n oAB se grafica en la figura 8-9. Esta gr&fica confirma que el rendimiento es mas alto cuando tantoyl 
como B estan en el nivel alto. 



Figura 8-9 Interacckm apertura-tiempo de exposid6n del ejemplo 8-2. 
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44.6 61.5 



Figura 8-10 Proyecci6n del diseno 2y~ } del 
ejemplo 8-2 en dos replicas de un diseno 2 3 en 
los factores A, B y C. 


El diseno 2 5-1 se reducird a dos r6plicas de un diseno 2 3 en tres cualesquiera de los cinco factores origi- 
nates. (Observar la figura 8-5 ayuda a visualizar esto.) La figura 8-10 es una grifica de cubo en los factores 
A, By C con los rendimientos promedio superpuestos en los ocho vertices. Es evidente por la inspeccidn 
de la gr&fica de cubo que los rendimientos m£s altos se consiguen con/1, B y C en el nivel alto. Los factores 
D y E tienen un efecto pequeno sobre el rendimiento promedio del proceso y pueden ajustarse en los va- 
lores que optimicen otros objetivos (como el costo). 


Secuencias de disenos factoriales fraccionados 

El uso de los disenos factoriales fraccionados lleva con frecuencia a una gran economia y eficiencia en la 
experimentacidn, en particular si las corridas pueden hacerse secuencialmente. Por ejemplo, suponga 
que se estan investigando k = 4 factores (2 4 = 16 corridas). Casi siempre es preferible correr un diseno 
fraccionado 2 4 “‘ (ocho corridas), analizar los resultados y despuds detidir cual es la mejor serie de corri- 
das que deberl correrse despuds. Si es necesario resolver ambigiiedades, siempre puede correrse la frac- 
ci6n altema y completar el diseno 2 4 . Cuando se usa este mdtodo para completar el diseno, ambas 
fracciones un medio representan bloques del diseno completo con las interacciones de orden superior 
confundidas con los bloques (en este caso ABCD estaria confundida). Por lo tanto, la experimentacidn se- 
cuencial tiene como resultado la pdrdida de informacion sdlo en la interaccidn de orden mas alto. Su ven- 
taja es que en muchos casos se saca informacion suficiente de la fraction un medio para proceder a la 
siguiente etapa de la experimentation, lo cual podria implicar la incorporation o elimination de factores, 
el cambio de las respuestas, o la variation de algunos de los factores en nuevos rangos. Algunas de estas 
posibilidades se ilustran grdficamente en la figura 8-11. 


EJEMPLO 8-3 

Considere nuevamente el experimento del ejemplo 8-1. Se ha usado un diseno 2 y se ha hecho la identi- 
fication tentativa de los tres efectos principales grandes: A,CyD. Hay dos efectos grandes asociados con 
interacciones de dos factores, v4C + BD y AD + BC. En el ejemplo 8-2 se utilizd el hecho de que el efecto 
principal de B era insignificante para concluir de manera tentativa que las interacciones importantes eran 



ACyAD . En ocasiones el experimentador tendr& que procesar conocimientos que puedan ayudarle a dis- 
criminar entre las interacciones que probablemente sean importantes. Sin embargo, siempre es posible 
aislar la interaccidn significativa corriendo la fraccidn altema, dada por / - -ABCD. Es directa la demos- 
tracidn de que el diseno y las respuestas son los siguientes; 


Corrida 

Diseno bdsico 

ABC 

D = -ABC 

Combinacidn de 
tratamientos 

fndice de 
filtracidn 

1 



_ 

+ 

d 

43 

2 

+ 

- 

- 

- 

a 

71 

3 

— 

+ 

- 

- 

b 

48 

4 

+ 


- 

+ 

abd 

104 

5 

* 

_ 

+ 

- 

c 

68 

6 

+ 

— 

+ 

+ 

acd 

86 

7 

— 

+ 

+ 

+ 

bed 

70 

8 

+ 

+ 

+ 

- 

abc 

65 
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Las combinaciones lineales de las observaciones obtenidas a paitir de esta fraccibn alterna son 

l' A = 24.25 •+ A- BCD 

t B = 4.75 -B-ACD 

C c = 5.75 -*C- ABD 

t' D = 1275 -> D- ABC 
t M m 1.25 -* AB-CD 
C AC = -11.15- AC- BD 
i’ AD = 14.25 •* AD- BC 

Estas estimaciones pueden combinarse con las que se obtuvieron de la fraccibn un medio original para 
obtener las siguientes estimaciones de los efectos: 


i 

De *(*, + *;) 


A 

21.63 -*A 

-2.63-* BCD 

B 

3.13 -*B 

-1.63 -*ACD 

C 

9.88 -*• C 

4.13 -ABD 

D 

14.63 — D 

1.88 -ABC 

AB 

0.13 -*AB 

-1.13 -* CD 

AC 

-18.13 -+AC 

-0.38 -* BD 

AD 

16.63 -*AD 

2.38 -BC 


Estas estimaciones concuerdan exactamente con las del andlisis original de los datos como una sola rbpli- 
ca de un disefio factorial 2 4 , como se consigna en el ejemplo 6-2. Evidentemente, son las interacciones-4C 
y AD las que son grandes. 


Agregar la fraccibn alterna a la fraccibn principal puede considerarse como un tipo de experimento 
de conflrmacibn, por cuanto proporciona informacibn que permitira fortalecer las conclusiones iniciales 
acerca de los efectos de la interaccibn de dos factores. En la seccibn 8-5 se investigaran otros aspectos de 
la combinacibn de diseiios factoriales fraccionados para aislar las interacciones. En ocasiones un experi- 
mento de confirmacibn no es tan elaborado como este. Por ejemplo, podria usarse la ecuacibn del modelo 
para predecir la respuesta en un punto de interes dentro del espacio del diseno (no uno de los puntos del 
diseno actual), correr despues realmente ese ensayo (quizd varias veces) y usar la comparacibn entre la 
respuesta predicba y la observada para confirmar los resultados. 


8-3 LA FRACCI6N UN CUARTO DEL DISENO 2 k 

Para un numero moderadamente grande de factores, con frecuencia son utiles fracciones menores del di- 
seno 2*. Considere una fraccibn un cuarto del diseno 2 k . Este diseno contiene 2 k ~ 2 corridas y es comun 11a- 
marlo diseno factorial fraccionado 2* -2 . 

El diseno 2 k 2 puede construirse apuntando primero un diseno bdsico compuesto por las corridas aso- 
ciadas con un diseno factorial complete en k— 2 factores y asociando despubs las dos columnas adiciona- 
les con las interacciones elegidas apropiadamente que incluyan los primeros k — 2 factores. Por lo tanto, 
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una fraction un cuarto del diseno 2 k tiene dos generadores. SiPyQ representan los generadores escogi- 
dos, entonces a / = P e / = Q se les llama las relaciones generadoras del diseno. Los signos de P y Q ( + 
o -) detenninan cual de las fracciones un cuarto se produce. Las cuatro fracciones asociadas con la elec- 
tion de los generadores ±P y ±Q pertenecen a la misma familia. La fraction para la que tanto P como Q 
son positivas es la fraction principal. 

La relacion de definition completa del diseno esta compuesta por todas las colu mn as que son iguales 
a la columna identidad I. Estas constarin dtP,Qy su interaction generalizada PQ; es decir, la relacion de 
definition es I = P — Q = PQ. A los elementos P,Qy PQ de la relacion de definition se les denomina pa- 
labras. Los alias de cualquier efecto se obtienen mediante la multiplication de la columna de ese efecto 
por cada palabra de la relacion de definition. Evidentemente, cada efecto tiene tres alias. El experimenta- 
dor debera estar atento al elegir los generadores para que los efectos potencialmente importantes no 
sean alias entre si. 

Como un ejemplo, considere el diseno 2 6-2 . Suponga que se escogen I = ABCE e / = BCDF como los 
generadores del diseno. Entonces la interaction generalizada de los generadores ABCE y BCDF es 
ADEF; por lo tanto, la relation de definiciOn completa de este diseno es 

/ = ABCE = BCDF ~ ADEF 

Por consiguiente, se trata de un diseno de resolution IV Para encontrar los alias de cualquier efecto (por 
ejemplo deA), se multiplica ese efecto por cada palabra de la relaciOn de definiciOn. Para A, esto produce 

A = BCE = ABCDF = DEF 

Es sencillo verificar que todos los efectos principales son alias de interacciones de tres y cinco factores, 
mientras que las interacciones de dos factores son alias entre si y de interacciones de Ordenes superiores. 
Por lo tanto, cuando se estimaA, por ejemplo, en realidad se esta estimandoA + BCE + DEF + ABCDF. 
En la tabla 8-8 se muestra la estructura completa de los alias de este diseno. Si las interacciones de tres 
factores y de Ordenes superiores son insignificantes, este diseno produce estimaciones tiaras de los efec- 
tos principales. 

Para construir este diseno se anota primero el diseno bdsico, el cual consiste en las 16 corridas para 
un diseno completo 2 6 2 = 2 4 enA, B. C y D. Despues se anaden los dos factores EyF, asociando sus nive- 
les m&symenos con los signos mOs y menos de la interaccidn ABC y BCD, respectivamente. Este procedi- 
miento se muestra en la tabla 8-9. 

Otra forma de construir este diseno es deduciendo los cuatro bloques del diseno 2 6 con ABCE y 
BCDF confundidas y eligiendo despues el bloque con las combinaciones de tratamientos que son positi- 
vas para ABCE y BCDF. Se trataria de un diseno factorial fraccionado 2 s-2 con relaciones generadoras / = 
ABCE e I = BCDF, y puesto que los dos generadores ABCE y BCDF son positivos, se trata de la fracciOn 
principal. 


labia 8-8 Estructura de los alias del disefio 2^, 2 
con I = ABCE = BCDF = ADEF 


A = BCE = DEF = ABCDF 
B = ACE = CDF = ABDEF 
C = ABE = BDF = ACDEF 
D = BCF = AEF = ABCDE 
E =ABC =ADF = BCDEF 
F = BCD = ADE = ABCEF 

ABD = CDE = ACF = BEF 
ACD = BDE * ABF = CEF 


AB = CE = ACDF = BDEF 
AC - BE = ABDF = CDEF 
AD = EF = BCDE = ABCF 
AE = BC = DF = ABCDEF 
AF = DE = BCEF = ABCD 
BD= CF - ACDE = ABEF 
BF ~ CD = ACEF = ABDE 
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labia 8-9 Construcci6n del disefio 2^ z con los generadores I — AfiCE e 1 = BCDF 


Corrida 

A 

Disefio Msico 

B C 

D 

E = ABC 

F = BCD 

1 

2 

+ 

~ 

- 

- 

+ 

- 

3 

- 

+ 

- 

- 

+ 

+ 

4 

+ 

+ 

- 

- 

- 

+ 

5 

- 

- 

+ 

- 

+ 

+ 

6 

+ 

- 

+ 

- 

- 

+ 

7 

- 

+ 

+ 

- 

_ 

_ 

8 

+ 

+ 

+ 

- 

+ 


9 

- 

- 

- 

+ 

- 

+ 

10 

+ 

- 

- 

+ 

+ 

+ 

11 

- 

+ 

- 

+ 

+ 

_ 

12 

+ 

+ 


+ 

- 

_ 

13 

- 

- 

+ 

+ 

+ 

_ 

14 

+ 

- 

+ 

+ 

- 


15 

- 

+ 

+ 

+ 

- 

+ 

16 

+ 


+ 

+ 

+ 

+ 


Hay, desde luego, tres fracciones altemas de este disefio 2^ 2 particular. Se trata de las fracciones 
con las reladones generadoras I = ABCE e / = -BCDF; I = -ABCE e / = BCDF; e / = -ABCE e I ~ 
-BCDF. Es sencillo construir estas fracciones con el metodo que se muestra en la tabla 8-9. Por ejemplo, 
si quiere encontrarse la fraccifin para la que I = ABCE e / = - BCDF , entonces en la ultima columna de la 
tabla 8-9 se hace F = -BCD, y la columna de los niveles del factor F queda como 

++ ++ — ++++ — 

La relacifin de definicifin completa de esta fraccifin altema es I = ABCE = -BCDF = -ADEF. Ahora 
ciertos signos en la estructura de los alias de la tabla 8-9 se han cambiado; por ejemplo, los alias de>4 son 
A = BCE = -DEF = -ABCDF. Por lo tanto, la combinacifin lineal de las observaciones i A estima en reali- 
dad A + BCE - DEF - ABCDF. 

Por ultimo, observe que el disefio factorial fraccionado 2^ 2 se proyectard en una sola replica de un 
disefio 2 4 en cualquier subconjunto de cuatro factores que no sea una palabra de la relacifin de definicifin. 
Ikmbifin se pliega en una fraccifin un medio con una rfiplica de un disefio 2 4 en cualquier subconjunto de 
cuatro factores que sea una palabra de la relacifin de definicifin. Por lo tanto, el disefio de la tabla 8-9 se 
convierte en dos replicas de un disefio 2 4 1 en los factores ABCE, BCDF y ADEF, porque estas son las pa- 
labras de la relacifin de definici6n. Hay otras 12 combinaciones de los seis factores, como ABC.D, ABCF, 
etc., para las que el disefio se proyecta en una sola rfiplica del disefio 2 4 . Este disefio tambifin se pliega en 
dos rfiplicas de un disefio 2 3 en cualquier subconjunto de tres de los seis factores o en cuatro rfiplicas de un 
disefio 2 2 en cualquier subconjunto de dos factores. 

En general, cualquier disefio factorial fraccionado 2*" 2 puede plegarse en un disefio factorial comple- 
to o bien en un disefio factorial fraccionado en algun subconjunto de r < k - 2 de los factores originates. 
Estos subconjuntos de variables que forman disefios factoriales completos no son palabras de la relacifin 
de definicifin completa. 

EJEMPLO 8-4 

Las piezas fabricadas en un proceso de moldeo por inyeccifin estan presentando una contraccifin excesi- 
va. Esto estfi ocasionando problemas en las operaciones de ensamblaje que se realizan despufis del mol- 
deo por inyeccifin. Un equipo de mejoramiento de calidad ha decidido llevar a cabo un experimento 
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disenado para estudiar el proceso de moldeo por inyeccibn a fin de poder reducir la contraccibn. El equi- 
po decide investigar seis factores — la temperatura de moldeo (.4), la velocidad del enroscado (5), el 
tiempo de retencibn (C), la duracibn del ciclo (D), el tamano del vaciadero ( E ) y la presibn de la retencibn 
( F ) — con dos niveles cada uno, con el fin de saber c6mo se afecta la contraccibn debido a cada factor, asi 
como para obtener informacibn preliminar acerca de la forma en que los factores interactuan. 

El equipo decide usar el diseno factorial fraccionado de 16 corridas con dos niveles de la tabla 8-9. El 
diseno se muestra de nuevo en la tabla 8-10, junto con la contraccibn observada (x 10) en la pieza de 
prueba producida en cada una de las 16 corridas del diseno. En la tabla 8-11 se muestran las estimaciones 
de los efectos, las sumas de cuadrados y los coeficientes de regresibn de este experimento. 

En la figura 8-12 se presenta la grdfica de probabilidad normal de las estimaciones de los efectos de 
este experimento. Los unicos efectos grandes son^l (temperatura de moldeo), B (velocidad del enrosca- 
do) y la interaccibnyli*. A la luz de las relaciones de los alias de la tabla 8-8, parece razonable adoptar es- 
tas conclusiones de manera tentativa. La gr&fica de la interaccibn AB de la figura 8-13 indica que el 
proceso muestra una alta insensibilidad a la temperatura si la velocidad del enroscado est& en el nivel 
bajo, pero que es muy sensible a la temperatura si la velocidad del enroscado esta en el nivel alto. Con la^ 
velocidad del enroscado en el nivel bajo, el proceso deberb producir una contraccibn promedio de alrede- 
dor de 10%, independientemente del nivel de temperatura elegido. 

Con base en este an&lisis initial, el equipo decide hacer el ajuste de la temperatura de moldeo y la ve- 
locidad del enroscado en el nivel bajo. Este conjunto de condiciones reducir^ la contraccibn media de las 
piezas en alrededor de 10%. Sin embargo, la variabilidad de la contraccibn de una pieza a otra sigue sien- 
do un problema potential. De hecho, la contraccibn media puede reducirse adecuadamente mediante las 
modificaciones anteriores; sin embargo, la variabilidad de la contraccibn de una pieza a otra en una corri- 
da de produccibn podria seguir causando problemas en el ensamblaje. Una manera de abordar esta cues- 
tibn es investigando si alguno de los factores del proceso afecta la variabilidad de la contraccibn de las 
piezas. 

En la figura 8-14 se presenta la gr£fica de probabilidad normal de los residuales, Esta grdfica parece 
ser satisfactoria. Se construyeron despubs las gr&ficas de los residuales contra cada factor. En la figura 


Tabla 8* 10 Un disefio 2^ 2 para el experimento del moldeo por inyeccibn del ejcmplo 84 
Diseno Msico 


Corrida A B C D E = ABC F — BCD 



Contraccibn 
observada (x 10) 

6 

10 

32 

60 

4 

15 
26 
60 

8 

12 

34 

60 

16 

5 

37 

52 
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Tabla 8*11 Efectos, sumas de cuadrados y coeficientes dc regresi6n del ejemplo 8*4 


Variable 

Nombre 

Nivel -1 

Nivel +1 

A 

temperaturamoldeo 

-1.000 

1.000 

B 

veloddad enroscado 

- 1.000 

1.000 

c 

duracidn retencidn 

- 1.000 

1.000 

D 

duracion riclo 

- 1.000 

1.000 

E 

tamano vaciadero 

-1.000 

1.000 

F 

presi6n_retenri6n 

- 1.000 

1.000 

Variable 0 

Coefiriente de regresidn 

Efecto estimado 

Suma de cuadrados 

Promedio global 

27.3125 



A 

6.9375 

13.8750 

770.062 

B 

17.8125 

35.6250 

5076.562 

C 

-0.4375 

-0.8750 

3.063 

D 

0.6875 

1.3750 

7.563 

E 

0.1875 

0.3750 

0.563 

F 

0.1875 

0.3750 

0.563 

AB + CE 

5.9375 

11.8750 

564.063 

AC + BE 

-0.8125 

-1.6250 

10.562 

AD+EF 

-2.6875 

-5.3750 

115.562 

AE + BC + DF 

-0.9375 

-1.8750 

14.063 

AF + DE 

0.3125 

0.6250 

1.563 

BD + CF 

-0.0625 

-0.1250 

0.063 

BF + CD 

-0.0625 

-0.1250 

0.063 

ABD 

0.0625 

0.1250 

0.063 

ABF 

-2.4375 

-4.8750 

95.063 


a S61o los efectos principales y las imeracciones de dos factores. 



Figura 8-12 Grdfica de probabilidad normal de los efectos del ejemplo 8-4. 
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Figura 8-13 Grdfica de la interaccidn AB (temperatura de mol- 
deo-velocidad del enroscado) para el ejemplo 8-4. 


8-15 se muestra una de estas graficas, la de los residuales contra el factor C (tiempo de retencidn). La gr&- 
fica revela que hay una dispersion sensiblemente menor en los residuales con el tiempo de retencidn bajo 
que con el tiempo de retencidn alto. Estos residuales se obtuvieron de la manera usual a partir del modelo 
de la contraccidn predicha: 

9 = h +$2 X 2 + 012 * 1*2 

= 27.3125+ 6.9375*, +17.8125^ +5.9375*^ 
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Figura 8-14 Gr£fica de probabilidad normal de los residuales del ejemplo 8-4. 
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Tiempo de retencidn <C) 

Figura 8-15 Residuales contra el tiempo de retention (C) para el 
ejemplo 8-4. 


donde x^x 2 yx^c 2 son las variables codificadas que corresponden a los factores A y B y a la interaction^.#. 
Entonces los residuales son 


e = y-y 


El modelo de regresion usado para producir los residuales elimina, en esentia, los efectos de localization 
de^4, B y AB de los datos; por lo tanto, los residuales contienen information acerca de la variabilidad no 
explicada. La figura 8-15 indica que existe un patron en la variabilidad y que la variabilidad de la contrac- 
ti6n de las piezas puede ser menor cuando el tiempo de retention esta en el nivel bajo (recuerde que en el 
capftulo 6 se senalo que los residuales s61o transmiten information acerca de los efectos de dispersion 
cuando es correcto el modelo de localizacidn o la media). 

Lo anterior se observa con mayor claridad en el analisis de los residuales que se presenta en la tabla 
8-12. En esta tabla, los residuales se ordenan en los niveles bajo (-) y alto ( + ) de cada factor, y se ha calcu- 
lado la desviacidn estandar de los residuales en los niveles bajo y alto de cada factor. Observe que la des- 
viacion est&ndar de los residuales con C en el nivel bajo [5(C) = 1.63] es considerablemente menor que la 
desviackm est&ndar de los residuales con C en el nivel alto [5(C + ) = 5.70]. 

En el ultimo rengldn de la tabla 8-12 se presenta el estadistico 

5 2 (/ + ) 


f; = In - 


s 2 (i~) 


Recuerde que si las yarianzas de los residuales en los niveles alto ( + ) y bajo (-) del factor i son iguales, en- 
tonces este cociente sigue una distribution aproximadamente normal con media cero, y puede usarse 
para evaluar la diferentia en la variabilidad de la respuesta en los dos niveles del factor i. Puesto que el 
cociente F'. es relativamente grande, se concluiria que la aparente dispersidn o efecto de variabilidad ob- 
servado en la figura 8-15 es real. Por lo tanto, ajustar el tiempo de retencidn en su nivel bajo contribuiria a 
reducir la variabilidad de una pieza a otra durante una corrida de production. En la figura 8-16 se presen- 
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Figura 8-16 Gr&fica de probabilidad normal de los efectos de dispersidn F* del ejemplo 8-4, 

ta una gr&fica de probabilidad normal de los valores F* de la tabla 8-12; 6sta tambidn indica que el factor 
C tiene un efecto de dispersion grande. 

En la figura 8-17 se muestran los datos de este experimento proyectados en un cubo en los factores^l, 
B y C. La contraccidn promedio observada y el rango de la contraction observada se indican en cada Veni- 
ce del cubo. Por la inspection de la figura se observa que correr el proceso con la velocidad del enroscado 
(5) en el nivel bajo es la clave para reducir la contraccidn promedio de las piezas. Si B est& en el nivel bajo, 
virtualmente cualquier combinacidn de la temperatura (4)yel tiempo de retencidn (C) resultard en valo- 
res bajos de la contraccidn promedio de las piezas. Sin embargo, al examinar los rangos de los valores de 
la contraccidn en cada vdrtice del cubo, es claro de inmediato que ajustar el tiempo de retencidn (C) en el 
nivel bajo es la unica election razonable si se quiere mantener baja la variabilidad de la contracci6n de 
una pieza a otra en una corrida de produccidn. 



Figura 8-17 Contracci6n promedio y rango de la contraccidn en los 
factores A, B y C para el ejemplo 8-4. 
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8-4 EL DISENO FACTORIAL FRACCIONADO 2 k ” GENERAL 


A un diseno factorial fraccionado 2 k que contiene 2*' p corridas se le llama fraccidn 1 J2 P del diseno 2 k o, de 
manera mas simple, diseno factorial fraccionado 2*" p . En estos diseiios deben seleccionarse p generadores 
independientes. La relacidn de definicidn de este diseno se compone de los p generadores elegidos ini- 
cialmente y sus 2 p -p-l interacciones generalizadas. En la presente seccidn se estudia la construccidn y el 
analisis de estos diseiios. 

La estructura de los alias puede encontrarse multiplicando la columna de cada efecto por la relacidn 
de definicidn. Debera prestarse atencion al elegir los generadores para que los efectos de interns poten- 
cial no sean alias entre si. Cada efecto tiene 2 P - 1 alias. Para valores moderadamente grandes de k, es co- 
mun suponer que las interacciones de drdenes superiores (por ejemplo, de tercero y cuarto orden y 
superiores) son insignificantes, con lo cual se simplifica en gran medida la estructura de los alias. 

Es importante seleccionar los p generadores de un diseno factorial fraccionado 2 k ~ p de tal modo que 
se obtengan las mejores relaciones de los alias posibles. Un criterio razonable es seleccionar los genera- 
dores para que el diseno 2 k ~ p resultante tenga la resolucidn mas alta posible. Para ilustrar, considere el di- 
seno 2 6 w 2 de la tabla 8-9, donde se usaron los generadores E —ABCyF = BCD, conlo cual se produce un 
diseno de resolucidn IV. Este es el diseno con la resolucidn mas alta. Si se hubieran seleccionado E = 
AB C y F = ABCD, la relacidn de definicidn completa hubiera sido I = ABCE = ABCDF = DEF, y el dise- 
no habria sido de resolucidn III. Se trata, evidentemente, de una eleccidn inferior porque sacrifica de ma- 
nera innecesaria informacidn acerca de las interacciones. 

En ocasiones la resolucidn por si sola no es suficiente para distinguir entre los diseiios. Por ejemplo, 
considere los tres disenos 2^ 2 de la tabla 8-13. Todos estos diseiios son de resolucidn IV, pero tienen es- 
tructuras de los alias muy diferentes (se ha supuesto que las interacciones de tres factores y las de drdenes 
superiores son insignificantes) con respecto a las interacciones de dos factores. Evidentemente, el diseno 
A es el que tiene m&s alias y el diseno C el que tiene menos, por lo que el diseno C seria una buena eleccidn 
para un diseno 2\y 2 . 

Las tres palabras del diseno^ tienen longitud 4; es decir, el patrdn de la longitud de las palabras es 
{4, 4, 4>. Para el diseno B es {4, 4, 6} y para el diseno C es {4, 5,5}. Observe que la relacidn de definicidn 
del diseno C tiene una sola palabra de cuatro letras, mientras que los demas disenos tienen dos o tres. Por 
lo tanto, el diseno C minimiza el mimero de palabras de la relacidn de definicidn que son de longitud mi- 
nima. A un diseno como este se le llama diseno de aberracion minima. Minimizar la aberracidn en un di- 
seno de resolucidn I? asegura que el diseno tiene el numero minirno de efectos principales que son alias de 


Tabla 8-13 Ires elecciones de generadores para el disefto 2jy 1 

Generadores del diseno A Generadores del diseno B: Generadores del diseno C: 

F =ABC, G = BCD F=ABC,G=ADE F = ABCD, G = ABDE 

I = ABCF = BCDG = ADFG I - ABCF = ADEG = BCDEFG I = ABCDF = ABDEG = CEFG 


Alias (interacciones de dos factores) 
AB - CF ' 

AC = BF 

AD = FG 

AG = DF 
BD = CG 

BG = CD 
AF - BC - DG 


Alias (interacciones de dos factores) 
AB = CF 
AC = BF 
AD = EG 
AE = DG 
AF - BC 

AG = DE 


Alias (interacciones de dos factores) 
CE ~ FG 
CF = EG 
CG = EF 
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interacciones de orden R - 1, el numero minimo de interacciones de dos factores que son alias de interac- 
ciones de orden R -2, etcetera. Referirse a Fries y Hunter [46] para mayores detalles. 

En la tabla 8-14 se presenta una selection de disenos factoriales fraccionados 2*^ para k < 15 factores 
y hastan < 128 corridas. Los generadores sugeridos en esta tabla resultar&n en un diseno con la resolu- 
ci6n mas alta posible. Son tambien los disenos con aberration minim a. 

Las relaciones de los alias para todos los disenos de la tabla 8-14 para los que n < 64 se presentan en 
la tabla Xll(a-w) del apdndice. Las relaciones de los alias incluidas en esta tabla se enfocan en los efectos 
principales y las interacciones de dos y tres factores. Se da la relation de definition completa para cada di- 
seno. Esta tabla del apendice hace muy sencillo seleccionar un diseiio con la resolucion suficiente para 
asegurar que cualesquiera interacciones de interns potencial puedan estimarse. 


EJEMPLO 8-5 

Para ilustrar el uso de la tabla 8-14, suponga que se tienen siete factores y que el interns se encuentra en 
estimar los siete efectos principales y hacerse una idea aproximada de las interacciones de dos factores. 
Estamos dispuestos a suponer que las interacciones de tres factores y de ordenes superiores son insignifi- 
cantes. Esta informacidn sugiere que un diseiio de resolucion IV seria apropiado. 

La tabla 8-14 muestra que se cuenta con dos fracciones de resolucidn IV: la 2^ 2 con 32 corridas y la 
2jy 3 con 16 corridas. La tabla XII del apdndice contiene las relaciones de los alias completas para estos 
dos disenos. Los alias para el diseno 2^ 3 de 16 corridas se encuentran en la tabla XII(i) del apendice. 
Observe que los siete efectos principales son alias de interacciones de tres factores. Las interacciones 
de dos factores son alias en grupos de tres. Por lo tanto, este diseiio satisfara los objetivos del problema; 
es decir, permitira la estimacidn de los efectos principales y dara cierta idea respecto de las interacciones 
de dos factores. No es necesario correr el diseno 2^ 2 , el cual requerirla 32 corridas. La tabla XII(j) del 
apendice indica que este diseno permitirla la estimacidn de los siete efectos principales y que 15 de las 21 
interacciones de dos factores tambien podrian estimarse de manera unica. (Recuerde que las interaccio- 
nes de tres factores y de 6rdenes superiores son insignificantes.) Esta es mils de la informackm necesaria 
acerca de las interacciones. El diseno completo se muestra en la tabla 8-15. Observe que se construyo em- 
pezando con la corrida 16 del diseno 2 4 enA,B,Cy D como el diseno basico y agregando despues las tres 
columnas E =ABC, F = BCD y G= ACD. Los generadores son I = ABCE, I = BCDF e / = ACDG (tabla 
8-14). La relacion de definicidn completa es / = ABCE = BCDF =ADEF =ACDG = BDEG — CEFG = 
ABFG. 


An&lisis de los disenos factoriales fraccionados 2 k 

Hay varios programas de computadora que pueden usarse para analizar el diseno factorial fraccionado 
2*^. Por ejemplo, el programa Design-Expert ilustrado en el capitulo 6 tiene esta capacidad. 

El diseno tambi6n puede analizarse recurriendo a los principios b^sicos; el efecto i-6simo se estima con 

_ 2(Contraste i ) _ Contras te j 
' ~N “ (N/2) 

donde el Contraste, se encuentra utilizando los signos positivos y negativos de la columna i y donde 
N = 2 k ~ p es el numero total de observaciones. El diseno solo permite la estimaci6n de 2 k ~ p - 1 efectos (y 
sus alias). 


Tabla 8-14 Disefios factorials fraccionados 2 k ~* seleccionados 


Numero de 


Numero de 

Generadores 

factores, k 

Fraccidn 

corridas 

del diseno 

3 

2 3 ' 1 

4 

C = ±AB 

4 

9 4-1 

Z IV 

8 

D = ±ABC 

5 

2 5 - 1 

16 

E = ±ABCD 


2 5-2 

8 

D = ±AB 

E = ±AC 

6 

2 6 " 1 

32 

F ~ ±ABCDE 


96-2 

Z IV 

16 

E= ±ABC 

F = ±BCD 


^ 6-3 

Z JJI 

8 

D = ±AB 

E = ±AC 

F = ±BC 

7 

2 7 - 1 

^VII 

64 

G = ±ABCDEF 


2 7 “ 2 

A IV 

32 

F= ±ABCD 

G = ±ABDE 


2 7 -3 

16 

±ABC 

F = ±BCD 

G = ±ACD 


2 7 “ 4 

z m 

8 

D = ±AB 

E= ±AC 

F = ±BC 

G = ±ABC 

8 

98-2 

z v 

64 

G = ±ABCD 

H = ±ABEF 


98-3 

Z JV 

32 

F= ±ABC 

G = ±ABD 

H = ±BCDE 


98-4 

Z IV 

16 

E = ±BCD 

F - ±ACD 

G = ±ABC 

H~ ±ABD 

9 

9 9-2 

Z VI 

128 

H = ±ACDFG 




J - ±BCEFG 


99-3 

^IV 

64 

G = ±ABCD 

H = ±ACEF 

J = ±CDEF 


99-4 

z iv 

32 

F = ±BCDE 

G ~ ±ACDE 

H= ±ABDE 

J = ±ABCE 


99-5 

z m 

16 

E = ±ABC 

F = ±BCD 

G = ±ACD 

H= ±ABD 






J= ±ABCD 

10 

910-3 

z v 

128 

H= ±ABCG 

J - ±ACDE 

K= ±ACDF 


Tabla 8-14 (continuaci6n) 


Numero de 
factores, k 


11 


12 


13 



Numero de 

Generadores 

Fracci 6 n 

corridas 

del diseno 

^10-4 

^IV 

64 

G = ±BCDF 

H = ±ACDF 
/= ±ABDE 

K = +ABCE 

9 IO -5 

L \v 

32 

F = ±ABCD 

G = ±ABCE 
H= ±ABDE 

J = ±ACDE 

K = ±BCDE 



9 10- 6 

16 

E = ±ABC 

F = ±BCD 

G = ±ACD 

H = ±ABD 

J= ±ABCD 
K= ±AB 

911-5 

L xv 

64 

G = ±CDE 

H = ±ABCD 

J= ±ABF 

K - ±BDEF 

L = +ADEF 

ry 11-6 

^IV 

32 

F= ±ABC 

G = ±BCD 

H = ±CDE 

J= ±ACD 
K= ±ADE 

L = ±BDE 

9U-7 

16 

E = ±ABC 

F = ±BCD 

G ~ ±ACD 
H= ±ABD 
/= ±ABCD 

K= ±AB 

L = ±AC 



9 12- s 

16 

E = ±ABC 

F = +ABD 

G = ±ACD 

H = ±BCD 

J = +ABCD 

K = ±AB 

L = ±AC 

M = ±AD 

}13-9 
^ III 

16 

E = ±ABC 

F= ±ABD 

G = ±ACD 

H = ±BCD 
J= ±ABCD 

K= ±AB 
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Tabla 8-14 (continuaci6n) 
Numero de 

factores, k Fraccidn 


14 


914-10 


15 


915-11 


Ntimero de Generadores 
corridas del diseno 

^ L = ±AC 
M= ±AD 
N= ±BC 

16 E = ±ABC 

F= ±ABD 
G = ±ACD 
H = ±BCD 
J = ±ABCD 
K= ±AB 
L = ±AC 
M= ±AD 
N= ±BC 
O = ±BD 
16 E = ±ABC 

F - ±ABD 
G = ±ACD 
H = ±BCD 
J = ±ABCD 
K= ±AB 
L = ±AC 
M= ±AD 
N = ±BC 
O - ±BD 
P - ±CD 


Tabla 8-15 Un disefio factorial fraccionado 2j v 3 


Diseno basico 


Corrida 

A 

B 

C 

D 

E - ABC 

F = BCD 

G =ACD 

1 

2 

+ 

- 

- 

- 

+ 

- 

+ 

3 

- 

+ 

- 

- 

+ 

+ 


4 

+ 

+ 

- 

- 

- 

+ 

+ 

5 

- 

- 

+ 

- 

+ 

+ 

+ 

6 

+ 

- 

+ 

- 

- 

+ 

— 

7 

- 

+ 

+ 

- 

- 

- 

+ 

8 

+ 

+ 

+ 

- 

+ 

- 

— 

9 

- 

- 

- 

+ 

- 

+ 

+ 

10 

+ 

- 

- 

+ 

+ 

+ 

_ 

11 

- 

+ 

- 

+ 

+ 

- 

+ 

12 

+ 

+ 

- 

+ 

- 

— 

— 

13 

- 

- 

+ 

+ 

+ 

— 


14 

+ 


+ 

+ 

- 

— 

+ 

15 

- 

+ 

+ 

+ 

- 

+ 

— 

16 

+ 

+ 

+ 

+ 

+ 

4- 

+ 
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Proyecci6n del diseno factorial fraccionado 2 fc -*' 

El diseno 2 t_p se reduce a un factorial completo o bien a un factorial fraccionado en cualquier subconjunto 
de r < k -p de los factores originates. Esos subconjuntos de factores que producen disenos factoriales 
fraccionados son subconjuntos que aparecen como palabras en la relacidn de definicion completa. Esto 
resulta de particular utilidad en los experimentos de tamizado cuando se sospecha desde el principio del 
experimento que la mayoria de los factores originales tendrdn efectos pequenos. El diseno factorial frac- 
cionado 2*~ p puede proyectarse entonces en un factorial completo, por ejemplo, en los factores de mayor 
interes. Las conclusiones a que se llegue con disenos de este tipo deberan considerarse tentativas y some- 
terse a analisis adicional. Por lo general es posible encontrar explicaciones altemativas de los datos que 
intervienen en interacciones de drdenes superiores. 

Como un ejemplo, considere el diseno 2~'~' del ejemplo 8-5. Se trata de un diseno con 16 corridas en 
el que intervienen siete factores. Se proyectarii en un factorial completo en cuatro cualesquiera de los sie- 
te factores originales que no sean una palabra de la relacion de definici6n. Hay 35 subconjuntos de cuatro 
factores, siete de los cuales aparecen en la relacidn de definicion completa (ver la tabla 8-15). Por lo tanto, 
hay 28 subconjuntos de cuatro factores que formarian disenos 2 4 . Una combinacion que es obvia al ins- 
pecdonar la tabla 8-15 es A, B, C y D. 

Para ilustrar apropiadamente la utilidad de esta proyeccidn, suponga que se realiza un experimento 
para mejorar la eficiencia de un molino de bolas y los siete factores son los siguientes: 

1. Veloddad del motor 

2. Muesca 

3. Modo de alimentacidn 

4. Tarnano de la alimentaci6n 

5. Tipo de material 

6. Angulo de la criba 

7. Nivel de vibracidn de la criba 

Se tiene una certeza razonable de que la velocidad del motor, el tarnano de la alimentacidn y el tipo de 
material afectar&n la eficienday que ademas estos factores pueden interactuar. Se sabe menos del papel 
de los otros tres factores, pero es probable que sean insignificantes. Una estrategia razonable serfa asig- 
nar la veloddad del motor, el modo de alimentackm, el tarnano de la alimentation y el tipo de material a 
las columnas^4, B, CyD, respectivamente, de la tabla 8-15. La muesca, el Angulo de la criba y el nivel de 
vibrad6n de la criba se asignarian a las columnas E, F y G, respectivamente. Si se est4 en lo correcto y las 
“variables menores” E, FyG son insignificantes, quedara un diseno 2 4 completo en las variables clave del 
proceso. 

Separation en bloques de disenos factoriales fraccionados 

Ocasionalmente, un diseno factorial fraccionado requiere tantas corridas que no es posible realizarlas to- 
das bajo condidones homogdieas. En estas situadones, los disenos factoriales fraccionados pueden con- 
fundirse o mezclarse en bloques. La tabla XII del apendice contiene los arreglos recomendados para la 
separacidn en bloques de varios de los disenos factoriales fraccionados de la tabla 8-14. El tarnano mini- 
mo de los bloques para estos disenos es de ocho corridas. 

Para ilustrar el procedimiento general, considere el diseno factorial fraccionado 2 6 w 2 con la relacidn 
de definicidn I = ABCE = BCDF = ADEF que se muestra en la tabla 8-10. Este diseno fraccionado con- 
tiene 16 combinaciones de tratamientos. Suponga que quiere correrse este diseno en dos bloques con 
ocho combinaciones de tratamientos cada uno. Al seleccionar una interaction para confundirla con los 
bloques, se observa por el examen de la estructura de los alias de la tabla XII(f) del ap6ndice que hay dos 



332 CAP1TULO 8 DISENOS FACTORIALES FRACCIONADOS DE DOS NIVELES 


Bloque 1 Bloque 2 


(1) 


ae 

abf 


acf 

cef 


bef 

abce 


be 

abef 


df 

bde 


abd 

acd 


ede 

bcdf 


abedef 


Figura 8-18 El diseno 
en dos bloques con ABD con- 
fundida. 


series de alias que incluyen unicamente interacciones de tres factores, La tabla sugiere seleccionar ABD 
(y sus alias) para confundirla con los bloques. Se obtendrian asi los dos bloques que se muestran en la fi- 
gura 8-18. Observe que el bloque principal contiene las combinaciones de tratamientos que tienen un nu- 
mero igual de letras en comun con ABD. Son tambidn las combinaciones de tratamientos para las que 
L - x x + x 2 + jc 4 = 0 (mod 2). 

EJEMPLO 8*6 

Se usa una m&quina CNC de cinco ejes para maquinar un propulsor utilizado en un motor de turbina. Los 
perfiles de los dlabes son una caracteristica importante de la calidad. Especificamente, es de interes la 
desviacidn del perfil del £labe del perfil especificado en el piano de ingenieria. Se corre un experimento 
para determinar cuales son los parametros de la m&quina que afectan la desviacidn del perfil. Los ocho 
factores seleccionados en el diseno son los siguientes: 


Factor 

Nivel bajo (-) 

Nivel alto (+) 

A = desviacidn en el ejex (0.001 pulg) 

0 

15 

B = desviacidn en el ejey (0,001 pulg) 

0 

15 

C = desviacidn en el eje z (0.001 pulg) 

0 

15 

D = fabricante de la herramienta 

1 

2 

E = desviacidn del eje a (0.001 grados) 

0 

30 

F = velocidad del aredmetro (%) 

90 

110 

G = altura de la plantilla sujetadora (0.001 pulg) 

0 

15 

H - velocidad de alimentacidn (%) 

90 

110 


Se selecciona un &labe de prueba en cada pieza para inspeccionarlo. La desviacidn del perfil se mide utili- 
zando una m&quina de medicidn coordenada, y la desviacidn est&ndar de la diferencia entre el perfil real y 
el perfil especificado se usa como la variable de respuesta. 

La maquina tiene cuatro aredmetros. Puesto que puede haber diferencias en los aredmetros, los in- 
genieros del proceso piensan que dstos deber&n tratarse como bloques. 

Los ingenieros se sienten confiados de que las interacciones de tres o mas factores no son muy impor- 
tantes, pero est&n renuentes a ignorar las interacciones de dos factores, Por la tabla 8-14 ? inicialmente dos 
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diserios parecen ser apropiados: el diseno 2^ 4 con 16 corridas y el diseno 2^ 3 con 32 corridas. La tabla 
XII(l) del apdndice indica que si se usa el diseno con 16 corridas, habr& un numero considerable de alias 
con interacciones de dos factores. Adem&s, este diseno no puede correrse en cuatro bloques sin confundir 
cuatro interacciones de dos factores con los bloques. Por lo tanto, los experimentadores deciden usar el 
diseno 2^ 3 en cuatro bloques. En este diseno se confunden con los bloques una cadena de alias de in- 
teracciones de tres factores y una interaccidn de dos factores (EH) y sus alias de interacciones de tres fac- 
tores. La interaccidn EH es la interaccidn entre la desviacidn del eje a y la velocidad de alimentacidn, y los 
ingenieros consideran que una interaccidn entre estas dos variables es altamente improbable. 

La tabla 8-16 contiene el diseno y las respuestas resultantes en t6rminos de desviacidn est&ndar x 10 3 
pulg. Puesto que la variable de respuesta es una desviacidn est£ndar, con frecuencia es mejor efectuar el 
an&lisis despu£s de una transformaci6n logaritmica. En la tabla 8-17 se muestran las estimaciones de los 
efectos. La figura 8-19 es una grftfica de probabilidad normal de las estimaciones de los efectos, utilizando 
In (desviacidn est&ndar x 10 3 ) como la variable de respuesta. Los unicos efectos grandes son^4 = desvia- 
ci6n del ejex, B = desviacion del ejey, y la cadena de alias que incluyeAD + BG . Ahora bien, AD es la in- 


Tabla 8-16 El diseno 2 8-3 en cuatro bloques del ejemplo 8-6 


Diseno bisico 

Corrida A B C D E F = ABC G =ABD H = BCDE 


Orden real Desviatidn est&ndar 
Bloque de las corridas ( x 10 3 pulg) 


1 

— 


— 

_ 

_ 

- 

_ 

+ 

3 

18 

2.76 

2 

+ 

_ 

- 

- 

- 

+ 

+ 

+ 

2 

16 

6.18 

3 

- 

+ 

_ 

- 

- 

+ 

+ 


4 

29 

2.43 

4 

+ 

+ 

— 

_ 

_ 


- 

- 

1 

4 

4.01 

5 

_ 

_ 

+ 

- 

_ 

+ 

_ 

- 

1 

6 

2.48 

6 

+ 

_ 

+ 

- 

_ 

- 

+ 

- 

4 

26 

5,91 

7 


+ 


- 

- 

- 

+ 

+ 

2 

14 

2.39 

8 

+ 

+ 

+ 

- 

_ 

+ 

- 

+ 

3 

22 

3,35 

9 

— 

_ 

— 

+ 

_ 

— 

+ 

- 

1 

8 

4.40 

10 

+ 


- 

+ 

- 

+ 

- 

- 

4 

32 

4.10 

11 

_ 

+ 

— 

+ 

- 

+ 

- 

+ 

2 

15 

3.22 

12 

+ 

+ 

_ 

+ 

- 

- 

+ 

+ 

3 

19 

3.78 

13 

_ 

- 

+ 

+ 

- 

+ 

+ 

+ 

3 

24 

5.32 

14 

+ 

- 

+ 

+ 

_ 

_ 

- 

+ 

2 

11 

3.87 

15 


+ 

+ 

+ 

- 

- 

- 

- 

4 

27 

3.03 

16 

+ 

+ 

+ 

+ 

- 

+ 

+ 

— 

1 

3 

2.95 

17 

— 

— 


_ 

+ 

— 

— 

- 

2 

10 

2.64 

18 

+ 

- 

- 

- 

+ 

+ 

+ 

— 

3 

21 

5.50 

19 

_ 

+ 

- 

_ 

+ 

+ 

+ 

+ 

1 

7 

2.24 

20 

+ 

+ 

- 

- 

+ 

- 

- 

+ 

4 

28 

4.28 

21 

- 

- 

+ 

_ 

+ 

+ 

_ 

+ 

4 

30 

2.57 

22 

+ 

- 

+ 

- 

+ 

- 

+ 

+ 

1 

2 

5.37 

23 

- 

+ 

+ 

- 

+ 

- 

+ 

- 

3 

17 

2.11 

24 

+ 

+ 

+ 

- 

+ 

+ 

- 

- 

2 

13 

4,18 

25 

- 

- 

- 

+ 

+ 

- 

+ 

+ 

4 

25 

3.96 

26 

+ 

- 

- 

+ 

+ 

+ 

- 

+ 

1 

1 

3.27 

27 

_ 

+ 

— 

+ 

+ 

+ 

- 


3 

23 

3.41 

28 

+ 

+ 

- 

+ 

+ 

- 

+ 

- 

2 

12 

4.30 

29 

- 

_ 

+ 

+ 

+ 

+ 

+ 

- 

2 

9 

4.44 

30 

+ 

- 

+ 

+ 

+ 

- 

- 

- 

3 

20 

3.65 

31 

- 

+ 

+ 

+ 

+ 

- 

- 

+ 

1 

5 

4.41 

32 

+ 

+ 

+ 

+ 

+ 

+ 

+ 

+ 

4 

31 

3.40 
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Tabla 8-17 Estimaciones de los efectos, coeficientes de tegresi6n y sumas de cuadrados del ejemplo 8-6 


Variable 

Nombre 

Nivel -1 

Nivel +1 

A 

Desviacidn del ejex 

0 

15 

B 

Desviacidn del ejey 

0 

15 

C 

Desviacidn delejez 

0 

15 

D 

Fabricante de la herramienta 

1 

2 

E 

Desviatidn del eje a 

0 

30 

F 

Velocidad del aredmetro 

90 

110 

G 

Altura de la plantilla sujetadora 

0 

15 

H 

Velocidad de alimentacidn 

90 

110 

Variable* 

Coeficiente de regresidn 

Efecto estimado 

Suma de cuadrados 

Promedio global 

1.28007 



A 

0.14513 

0.29026 

0.674020 

B 

-0.10027 

-0.20054 

0.321729 

C 

-0.01288 

-0.02576 

0.005310 

D 

0.05407 

0.10813 

0.093540 

E 

-2.531E-04 

-5.063E-04 

2.050E-06 

F 

-0.01936 

-0.03871 

0.011988 

G 

0.05804 

0.11608 

0.107799 

H 

0.00708 

0.01417 

0,001606 

AB + CF + DG 

-0.00294 

-0.00588 

2.767E-04 

AC + BF 

-0.03103 

-0.06206 

0.030815 

AD + BG 

-0.18706 

-0.37412 

1.119705 

AE 

0.00402 

0.00804 

5.170E-04 

AF + BC 

-0.02251 

-0.04502 

0.016214 

AG + BD 

0.02644 

0.05288 

0.022370 

AH 

-0.02521 

-0.05042 

0.020339 

BE 

0.04925 

0.09851 

0.077627 

BH 

0.00654 

0.01309 

0.001371 

CD + FG 

0.01726 

0,03452 

0.009535 

CE 

0.01991 

0.03982 

0.012685 

CG+DF 

-0.00733 

-0.01467 

0.001721 

CH 

0.03040 

0.06080 

0.029568 

DE 

0.00854 

0.01708 

0,002334 

DH 

0.00784 

0.01569 

0.001969 

EF 

-0.00904 

-0.01808 

0.002616 

EG 

-0.02685 

-0.05371 

0.023078 

EH 

-0.01767 

-0,03534 

0,009993 

FH 

-0.01404 

-0.02808 

0.006308 

GH 

0.00245 

0.00489 

1.914E-04 

ABE 

0.01665 

0.03331 

0,008874 

ABH 

-0.00631 

-0.01261 

0.001273 

ACD 

-0.02717 

-0.05433 

0.023617 


fl S61o los efectos prinripales y las interacciones de dos factores. 
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teractidn desviacidn del eje x-fabricante de la herramienta, y BG es la interaccidn desviacidn del eje 
y-altura de la plantilla sujetadora, y como estas dos interacciones son alias es imposible separarlas con 
base en los datos del experimento en curso. Puesto que ambas interacciones incluyen un efecto principal 
grande, tambidn es dificil aplicar cualquier simplificacidn ldgica “obvia” en esta situation. Si se contara 
con algun conocimiento de ingenieria o del proceso que arrojara luz sobre la situacidn, entonces quiza po- 
dria hacerse una election entre las dos interacciones; en caso contrario, se necesitarAn mas datos para se- 
parar estos dos efectos (el problema de agregar corridas en un diseno factorial fraccionado para separar 
los alias de las interacciones, se estudia en la seccidn 8-5 y en el material suplementario de este capitulo). 

Suponga que el conocimiento del proceso sugiere que posiblemente la interaccidn apropiada sea AD. 
La tabla 8-18 es el an&lisis de varianza resultante para el modelo con los factores-4, B, D y AD (el factor D 
se incluyd para preservar el principio de jerarquia). Observe que el efecto del bloque es pequeno, lo cual 
sugiere que los aredmetros de la maquina no son muy diferentes. 

La figura 8-20 es una grafica de probabilidad normal de los residuales de este experimento. Esta grd- 
fica sugiere la presencia de colas ligeramente mis gruesas que las normales, por lo que posiblemente de- 


Tabla 8-18 AnSlisis de varianza del ejemplo 8-6 


Fuente de variacidn 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

F 0 

Valor P 

A 

0.6740 

1 

0.6740 

39.42 

<0.0001 

B 

0.3217 

1 

0.3217 

18.81 

0.0002 

D 

0.0935 

1 

0.0935 

5.47 

0.0280 

AD 

1.1197 

1 

1.1197 

65.48 

<0.0001 

Bloques 

0.0201 

3 

0.0067 



Error 

0.4099 

24 

0.0171 



Tbtal 

2.6389 

31 
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Figure 8-20 Gr£fica de probabilidad normal de los residuales del ejemplo 8-6. 



Figure 8-21 Gr&fica de la interaccidn AD para el ejemplo 8-6. 


001 x d 
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1.247 1.273 



Figura 8-22 El disciio 2 ,' v ' del ejemplo 8-6 proyectado en cuatro 
replicas de un diseno 2 3 en los factores A, B y D. 


ban considerarse otras transformaciones. La gr£fica de la interaction AD se presenta en la figura 8-21. 
Observe que el fabricante de la herramienta (D) y la magnitud de la desviacion del ejejc (A) tienen un im- 
pacto profundo en la variabilidad, del perfil del 41abe, de las especificaciones de diseno. CorrerA en el ni- 
vel bajo (0 desviacion) y comprar las herramientas al fabricante 1 produce los mejores resultados. En la 
figura 8-22 se muestra la proyecciOn de este diseno 2^ 3 en cuatro replicas de un diseno 2 3 en los factores 
A, B y D. La mejor combination de las condiciones de operation es A en el nivel bajo (0 desviacion), B en 
el nivel alto (0.015 en desviacidn) y D en el nivel bajo (fabricante de herramientas 1). 


8-5 DISENOS DERESOLUCI6N III 

Como se senalO anteriormente, el uso secuencial de los disenos factoriales fraccionados es muy util, lle- 
vando con frecuencia a una gran economfa y eficiencia de la experimentation. Se ilustran ahora estas 
ideas utilizando la clase de los disenos de resolution III. 

Es posible construir disenos de resolution III para investigar hasta k = N - 1 factores en s61o N corri- 
das, donde N es un multiplo de 4. Con frecuencia estos disenos son utiles en la experimentacion indus- 
trial. Los disenos en los que N es una potencia de 2 pueden construirse con los mdtodos presentados 
anteriormente en este capitulo, y Ostos se presentan primero. De particular importancia son los disenos 
que requieren 4 corridas para hasta 3 factores, 8 corridas para hasta 7 factores y 16 corridas para hasta 15 
factores. Si k = N - 1, se dice que el diseno factorial fraccionado esta saturado. 

Un diseno para analizar hasta tres factores en cuatro corridas es el diseno 2^*, el cual se presentb en 
la section 8-2. Otro diseno factorial fraccionado saturado muy util es el diseno para estudiar siete factores 
en ocho corridas, es decir, el diseno 2j„ 4 . Este diseno es una fraction un dieciseisavo del diseno 2 7 . Puede 
construirse apuntando primero los niveles positivos y negativos de un diseno 2 3 completo en A, B y C 
como el diseno basico, y asotiando despues los niveles de cuatro factores adicionales con las interacciones 
de los tres factores originales de la siguiente manera: D = AB, E = AC, F = BC y G - ABC. Por lo tanto, 
los generadores de este disefio son I = ABD, I = ACE , I - BCF e / = ABCG. El diseno se muestra en la ta- 
bla 8-19. 
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labia 8-19 El disefio 2^ 4 con los generadores I — ABD, I — ACE, I = BCF e I = ABCG 


Corrida 

Disefio bdsico 

ABC 

D —AB 

E — AC 

F = BC 

G=ABC 


1 

- 

_ 

— 

+ 

+ 

+ 

- 

def 

2 

+ 



- 

- 

+ 

+ 

afS 

3 

- 


- 

- 

+ 

- 

+ 

beg 

4 

+ 

+ 


+ 

- 

- 

- 

abd 

5 

- 

- 

+ 

+ 

- 

- 

+ 

cdg 

6 

+ 

- 

+ 

— 

+ 

- 

- 

ace 

7 

- 

+ 

+ 

- 

- 

+ 

- 

bcf 

8 

+ 

4" 

+ 

+ 

+ 

+ 

+ 

abcdefg 


La relacibn de definicibn completa de este disefio se obtiene multiplicando entre si los cuatro genera- 
dores^lBD, ACE, BCF yABCG de dos en dos, de tres en tres y los cuatro a la vez, de donde se obtiene 

I = ABD = ACE = BCF = ABCG = BCDE = ACDF = CDG 
= ABEF= BEG= AFG- DEF= ADEG= CEFG= BDFG= ABCDEFG 


Para encontrar los alias de cualquier efecto, simplemente se multiplica el efecto por cada palabra de la re- 
lation de definicibn. Por ejemplo, los alias de B son 

B = AD= ABCE= CF= ACG= CDE= ABCDF= BCDG- AEF= EG 
= ABFG= BDEF= ABDEG= BCEFG= DFG= ACDEFG 

Este disefio es una fraccibn un dieciseisavo, y como los signos elegidos para los generadores son posi- 
tivos, se trata de la fracdbn principal. Es tambibn de resolucibn III porque el numero menor de letras de 
cualquier palabra de la definicibn de contraste es tres. Cualquiera de los 16 diferentes disenos 2 7 m 4 de esta 
familia podria construirse utilizando los generadores con 1 de los 16 arreglos posibles de los signos en 
I = ±ABD, I = ±ACE, I = ±BCF, I = ±ABCG. 

Los siete grados de libertad de este disefio pueden usarse para estimar los siete efectos principales. 
Cada uno de estos efectos tiene 15 alias; sin embargo, si se supone que las interacciones de tres o m&s fac- 
tores son insignificantes, se consigue entonces una simplificacibn considerable en la estructura de los alias. 
Estableciendo este supuesto, cada una de las combinaciones lineales asociadas con los siete efectos 
principales de este disefio es en realidad una estimacibn del efecto principal y las tres interacciones de dos 
factores: 

( A -* A+BD+CE+FG 
i B -* B+AD+CF+EG 
t c -*C+AE+BF+DG 

i D -* D + AB + CG+ EF (8 - l) 

£ e -* E+ AC+ BG+ DF 
l F -* F + BC +AG+ DE 
l G -*G+CD+BE+AF 

Estos alias se encuentran en la tabla XII(h) del apbndice, ignorando las interacciones de tres factores y de 
brdenes superiores. 
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El diseno saturado 2]~ 4 de la tabla 8-19 puede usarse para obtener disenos de resolucidn III para es- 
tudiar menos de siete factores en ocho corridas, Por ejemplo, para generar un diseno para seis factores en 
ocho corridas, simplemente se elimina cualquiera de las columnas de la tabla 8-19, digamos la G . Se obtie- 
ne asi el diseno que se muestra en la tabla 8-20, 

Es sencillo verificar que este diseno es tambi£n de resolucidn III; de hecho es un diseno 2f„ 3 , o una 
fraccidn un octavo, del diseno 2 6 . La relation de definition del diseno 2 ^ 3 es igual a la relacidn de defini- 
ci6n del diseno 2^ 4 original, con las palabras que incluyen la letra G eliminadas. Por lo tanto, la relacidn 
de definicidn del nuevo diseno es 

1 = ABD= ACE= BCF= BCDE= ACDF - ABEF = DEF 

En general, cuando se eliminan d factores para producir un nuevo diseno, la nueva relation de definicidn 
se obtiene de las palabras de la relation de definicidn original que no contienen ninguna de las letras eli- 
minadas. Cuando se construyen disenos con este m6todo, debera prestarse atencidn para obtener el me- 
jor arreglo posible. Si se eliminan las columnas B,D,Fy G de la tabla 8-19, se obtiene un diseno para tres 
factores en ocho corridas, no obstante que las combinaciones de tratamientos corresponden a dos repli- 
cas de un diseno 2 3 . Probablemente el experimentador preferina correr un diseno 2 3 completo en^4, CyE. 

Thmbidn es posible obtener un diseno de resolution III para estudiar hasta 15 factores en 16 corridas. 
Este diseno 2} I 5 f 11 saturado puede generarse apuntando primero las 16 combinaciones de tratamientos 
asociadas con un diseno 2 4 en^4,i?, CyDe igualando despu€s 11 nuevos factores con las interacciones de 
dos, tresy cuatro factores de los cuatro factores originales. En este diseno, cada uno de los 15 efectos prin- 
cipales es alias de siete interacciones de dos factores. Puede usarse un procedimiento similar para el dise- 
no 2^J“ 26 , lo cual permite el estudio de hasta 31 factores en 32 corridas. 


Ensamblaje secuencial de fracciones para separar efectos 

Mediante la combination de disenos factoriales fraccionados en los que se han intercambiado ciertos sig- 
nos, es posible aislar de manera sistem&tica los efectos de inter6s potential. A este tipo de experimento 
secuencial se le llama doblez o plegado {fold over) del diseno original. La estructura de los alias de cual- 
quier fraccidn con los signos de uno o m£s de los factores invertidos se obtiene haciendo el cambio de sig- 
no apropiado en los factores de la estructura de los alias de la fraccidn original. 


Tabla 8-20 

El diseno 2 

ra 3 con 

los generadores I 

= A BD,I 

= ACE e 1 = BCF 



Corrida 

Diseno bSsico 

ABC 

D =AB 

E = AC 

F = BC 


1 

— 

— 

_ 

+ 

+ 

+ 

def 

2 

+ 

- 

- 

- 

- 

+ 

af 

3 

- 

+ 

— 


+ 

- 

be 

4 

+ 

+ 

- 

+ 

- 

- 

abd 

5 

- 

- 

+ 

+ 

- 

- 

cd 

6 

+ 

- 

+ 

- 

+ 

- 

ace 

7 

- 

+ 

+ 

- 

- 

+ 

bcf 

8 

+ 

+ 

+ 

+ 

+ 

+ 

abcdef 
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Considere el diseno 2^ 4 de la tabla 8-19. Suponga que junto con esta fraction principal se corre tam- 
bien un segundo diseno fraccionado con los signos invertidos en la columna del factor D. Es decir, la co- 
lumna de D de la segunda fracci6n es 

-++ — ++- 


Los efectos que pueden estimarse a partir de la primera fraccidn se muestran en la ecuacion 8-1, y a partir 
de la segunda fraccidn se obtiene 


es decir. 


t' A -* A- BD+ CE+FG 
£'„ B- AD+CF+EG 
£' c -* C+AE+BF-DG 
l' D -* D— AB- CG- EF 
C D -+-D+AB+CG+EF 
t' E E+AC+BG- DF 
l' F F+BC+AG- DE 
i' c ^G-CD+BE+AF 


suponiendo que no son significativas las interacciones de tres factores y de ordenes superiores. Ahora 
bien, a partir de las dos combinaciones lineales de los efectos + £',) y - e\) se obtiene 


i 

De^i-K) 


A 

A + CE + FG 

BD 

B 

P + CF + EG 

AD 

C 

C+AE+BF 

DG 

D 

D 

AB + CG +EF 

E 

E+AC + BG 

DF 

F 

F+BC+AG 

DE 

G 

G + BE+AF 

CD 


Por lo tanto, se ha aislado el efecto principal de D y todas sus interacciones de dos factores. En gene- 
ral, si a un diseno fraccionado de resolution III o mayor se le agrega una fraction adicional con los signos 
de un solo factor invertidos, entonces el diseno combinado producirO las estimaciones del efecto principal 
de ese factor y sus interacciones de dos factores. 

Suponga ahora que a un diseno fraccionado de resoluciOn III se le agrega una segunda fraction en la 
que los signos de todos los factores est&n invertidos. Este tipo de doblez (llamado en ocasiones doblez com- 
plete o reflexiOn) rompe los vinculos de alias entre los efectos principals y las interacciones de dos facto- 
res. Es decir, puede usarse el diseno combinado para estimar todos los efectos principals quitados de 
todas las interacciones de dos factores. En el siguiente ejemplo se ilustra la tecnica. 

EJEMPLO 8-7 

Un analista de desempeno humano conduce un experimento para estudiar el tiempo de enfoque del ojo y 
ha construido un aparato en el que pueden controlarse varios factores durante la prueba. Los factores 
que considera importantes inicialmente son la agudeza o claridad visual {A), la distancia del objetivo al 
ojo (B), la fonna del objetivo (C), el nivel de iluminacidn (D), el tamano del objetivo (E), la densidad del 
objetivo (F) y el sujeto (G). Se consideran dos niveles de cada factor. El analista sospecha que s61o algu- 
nos de estos siete factores son de importancia principal y que pueden omitirse las interacciones de 6rde- 
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Tabla 8-21 Diseno 2^ 4 para el experimento del tiempo de enfoque del ojo 


Corrida 

A 

Diseno bfisico 

B 

C 

D=AB 

£=AC 

F = BC 

G =ABC 

Tiempo 

1 

_ 

_ 

_ 

+ 

+ 

+ 

- 

def 

85.5 

2 

+ 

_ 

_ 


- 

+ 

+ 

afg 

75.1 

3 

_ 

+ 

— 

_ 

+ 

- 

+ 

beg 

93,2 

4 

+ 

+ 

_ 

+ 

- 

- 

- 

abd 

145.4 

5 

_ 

- 

+ 

+ 

- 

- 

+ 

cdg 

83.7 

6 

+ 

_ 

+ 

_ 

+ 

- 

- 

ace 

77.6 

7 


+ 

+ 

- 

- 

+ 

- 

bcf 

95.0 

8 

+ 

+ 

+ 

+ 

+ 

+ 

+ 

abcdefg 

141.8 


nes superiores entre los factores. Con base en este supuesto, el analista decide correr un experimento de 
tamizado para identificar los factores m&s importantes para despues enfocar el estudio en los mismos. 
Para explorar estos siete factores, el experimentador corre las combinaciones de tratamientos del diseno 

de la tabla 8-19 de manera aleatoria, obteniendo los tiempos de enfoque en milisegundos, como se 
muestra en la tabla 8-21. 

A partir de estos datos pueden estimarse siete efectos principales y sus alias. Por la ecuacidn 8-1 se 
observa que los efectos y sus alias son 

l A — 20.63 A + BD+CE + FG 

i B = 38.38 •* B+AD+CF+EG 
i c = - 0.28 -+C+AE+BF+DG 
28.88 ^D+AB+CG+EF 
t E = -0.28 E+AC+BG+DF 
£ F — — 0.63 /**+ BCA AG A DE 

£ G = — 2.43 G+ CD+ BE A AF 

Por ejemplo, 

t A = {(-85.5-1-75,1-932+145,4- 83,7 + 77.6- 95.0+141.8) = 20,63 

Los tres efectos m&s grandes son t A , t B y i D , La interpretacidn m&s simple de los datos es que los efectos 
principales de A, B y D son todos significativos. Sin embargo, esta interpretacidn no es unica, ya que otra 
conclusidn 16gica seria que A, B y la interaccidn ALB, o quiz££, D y la interaccidn BD , o tal vez A, D y la in- 
teraccidn AD son los verdaderos efectos. 

Observe quo ABD es una palabra en la relation de definicidn de este diseno. Por lo tanto, este diseno 
2^ 4 no se proyecta en un factorial 2 3 en ABD; en cambio, se proyecta en dos replicas de un diseno 2 3 ' 1 , 
como se ilustra en la figura 8-23. Puesto que el diseno 2 3 " 1 es de resolucidn III, A serd alias de BD , B serd 
alias de AD y D ser& alias de AB, por lo que no es posible separar las interacciones de los efectos principa- 
les, En este caso, quiz£ el analista haya tenido mala suerte. Si hubiera asignado el nivel de iluminacidn a C 
en lugar de a D, el diseno se habrfa proyectado en un diseno 2 3 completo, y la interpretation podria haber 
sido mas sencilla, 

Para separar los efectos principales y las interacciones de dos factores, se corre una segunda fraccidn 
con todos los signos invertidos. Este doblez del diseno se muestra en la tabla 8-22, junto con las respuestas 
observadas. Note que cuando se hace el doblez de un diseno de resolucidn III de esta manera, de hecho se 
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Figura 8-23 El diseno 2] n ' proyectado en 
dos replicas deun diseno 2^’ cnA.B yD. 


cambian los signos de los generadores que tienen un numero impar de letras. Los efectos estimados por 
esta fraccidn son 

i' A =-17.68 A- BD- CE- FG 
e' B = 37.73 -*B-AD-CF-EG 
t' c = -3.33 -+C-AE-BF-DG 
t D = 29.88 -* D-AB-CG— EF 
t' M - 0.53 -*■ E— AC- BG- DF 
t'„ = 1.63 ^F-BC-AG-DE 

t' G = 2.68 G— CD— BE— AF 

A1 combinar esta segunda fraccidn con la original se obtienen las siguientes estimaciones de los efectos: 


i 

De-KL + f;) 

DeK*,-4) 

A 

A = 1.48 

BD + CE + FG = 19.15 

B 

B = 38.05 

AD F CF + EG = 0.33 

C 

C = -1.80 

AE + BF + DG= 1.53 

D 

D= 29.38 

AB + CG+EF = -0.50 

E 

E = 0.13 

AC + BG + DF = -0.40 

F 

F = 0.50 

+D£ = -1.53 

G 

G = 0.13 

CD + + AF = -2.55 


Tabla 8-22 Un doblez del disefio 2^ 4 en el experiment del tiempo de enfoque del ojo 


Corrida 


Diseno Msico 

B 

C 

D = -AB 

E = -AC 

F - -BC 

G=ABC 


Tiempo 

1 

+ 

+ 

+ 

- 

- 

- 

+ 

abcg 

91.3 

2 

- 

+ 

+ 

+ 

+ 

- 

- 

bcde 

136.7 

3 

+ 

- 

+ 

+ 

- 

+ 

- 

acdf 

82.4 

4 

- 

- 

+ 

- 

+ 

+ 

+ 

cefg 

73.4 

5 

+ 

+ 

- 

- 

+ 

+ 

- 

abef 

94.1 

6 

- 

+ 

- 

+ 

- 

+ 

+ 

bdfg 

143.8 

7 

+ 

- 

- 

+ 

+ 

- 

+ 

adeg 

87.3 

8 

- 

- 

- 

- 

- 

- 

- 

(1) 

71.9 
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Los dos efect os mas grandes soni?yD. Ademas, el tercer ef ecto mas grande es BD + CE + FG, por lo 
que parece razonable atribuir esto a la inter accibn BD. El analista uso los dos factores, distancia (B) y ni- 
vel de iluminacion (D), en experimentos subsecuentes con los demas factores.4, C,Ey Fen ajustes est&n- 
dar, y verified los resultados obtenidos aqui. Decidib usar los sujetos como bloques en estos nuevos 
experimentos en lugar de ignorar el efecto potencial del sujeto debido a que fue necesario utilizar varios 
sujetos diferentes para completar el experimento. 


La relacibn de definicidn para un diseno de doblez 

La combination de disenos factorials fraccionados por medio de un doblez, como la que se hizo en el 
ejemplo 8-7, es una tbcnica muy titil. Con frecuencia es de interbs conocer la relacibn de definicibn del di- 
seno combinado. Puede determinarse con facilidad. Cada fraction separada tendril L + U palabras usa- 
das como generadores: L palabras con el mismo signo y U palabras con signos diferentes. En el diseno 
combinado se usaranL + U- 1 palabras como generadores. Estas ser&n lasL palabras con el mismo signo 
y las t7- 1 palabras que constan de productos pares independientes de las palabras que tienen signos dife- 
rentes. (Los productos pares son las palabras tomadas de dos en dos, de cuatro en cuatro, etcetera.) 

Para ilustrar este procedimiento, considere el diseno del ejemplo 8-7. Para la primera fraccibn, los ge- 
neradores son 

I = ABD, I = ACE, I — BCF e I=ABCG 

y para la segunda fraccibn son 

I = -ABD, I = -ACE, I = -BCF e ABCG 

Observe que en la segunda fraccibn se han intercambiado los signos de los generadores con un numero 
impar de letras. Asimismo, observe que L + E7=l + 3 — 4. El diseno combinado tendr&/ —ABCG (la pa- 
labra con el mismo signo) como generador y dos palabras que son productos pares independientes de las 
palabras con signos diferentes. Por ejemplo, tbmese / = ABD e I = ACE ; entonces I = (ABD)(ACE) = 
BCDE es un generador del diseno combinado. Asimismo, tdmese / = ABD e I = BCF ; entonces 
I = (ABD)(BCF) = ACDF es un generador del diseno combinado. La relacidn de definition completa 
para el diseno combinado es 

/ = ABCG= BCDE = ACDF = ADEG- BDFG= ABEF = CEFG 
Disenos de Plackett>Burman 

Estos disenos, atribuidos a Plackett y Burman, son disenos factoriales fraccionados de dos niveles para es- 
tudiar k = N-1 variables en N corridas, donde Wes un multiplo de 4. Si Nes una potencia de 2, estos dise- 
nos son identicos a los que se presentaron anteriormente en esta seccidn. Sin embargo, para N = 12, 20, 
24, 28 y 36, los disenos de Plackett-Burman en ocasiones son de interns. Puesto que estos disenos no pue- 
den representarse como cubos, en ocasiones se les llama disenos no geometricos. 

En la mitad superior de la tabla 8-23 se presentan los renglones de signos positivos y negativos que se 
usan para construir los disenos de Plackett-Burman para N — 12, 20, 24 y 36, mientras que en la mitad in- 
ferior de la tabla se presentan los bloques de signos positivos y negativos para construir el disefto para N = 
28, Los disenos para N = 12, 20, 24 y 36 se obtienen escribiendo el renglon apropiado de la tabla 8*23 
como una columna (o rengldn). Entonces se genera una segunda columna (o renglon) a partir de la pri- 
mera moviendo los elementos de la columna (o renglon) hacia abajo (o hacia la derecha) una posicidn y 
colocando el tiltimo elemento en la primera posicibn. Una tercera columna (o renglbn) se produce a par- 
tir de la segunda de manera similar, y el proceso se continua hasta que se genera la columna (o renglon) k. 
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labia 8-23 Signos positivos y negativos para los disenos de Plackett-Burman 


k= 11, N = 12 + +-+++ +- 

k =19, N = 20++ — + + + +-+-+ — 
k =23, N = 24+ + + + +-+-++ — + + 
k = 35 N — 36 — 1 1- + + 1- + + + + 

-+ + +--+ +-+-++—+" 



k —27, N = 28 


+-++++ 

+ 

l 

l 

+ 

1 

l 

l 

+ 

1 

++-+-++-+ 

++-+++ 


-++++“++- 

-+++++ 

1 

+ 

l 

1 

+ 

1 

1 

l 

+ 

4 1 + 4 1 — h 

+-++++ 

+ 

+ -4-4-4- -4- -+ 

++-+++ 

+ + +-- 

+ + —+ + + +- 

+++++ 

I 

+ 

l 

l 

l 

+ 

l 

+ 

l 

-+++-+ -+ + 

+ + + +- + 

l 

+ 

l 

+ 

l 

l 

+ 

l 

l 

+-++-+++- 

+ + + ++- 

+ 

1 

l 

l 

1 

+ 

l 

1 

+ 

++-++--++ 

+ + + + + 

— 4 4- —4 — — 

-++-+++-+ 


Despues se agrega un renglon de signos negativos, completandose asi el diseno. Para AT = 28, los tres bio - 
ques X, Y y Z se apuntan en el orden 

X Y Z 

Z X Y 

Y Z X 

y se agrega un rengldn de signos negativos a estos 27 renglones. El diseno para N = 12 corridas y k = 11 
factores se muestra en la tabla 8-24. 

Los disenos no geomtstricos de Plackett-Burman para V = 12, 20, 24, 28 y 36 tienen estructuras de los 
alias muy intrincadas. Por ejemplo, en el diseno de 12 corridas, todos los efectos principales son alias par- 
ciales de cada una de las interacciones de dos factores en los que no est&n incluidos. Por ejemplo, la in- 
teraction AB es alias de los nueve efectos principales C, D, K. Adernas, cada uno de los efectos 
principales son alias parciales de 45 interacciones de dos factores. En disenos mas grandes, la situation es 
todavia mas compleja. Se recomienda al experimentador usar estos disenos con mucho cuidado. 


Tabla 8-24 Diseno de Plackett-Burman para N=12, k=ll 


>rrida 

A 

B 

C 

D 

E 

F 

G 

H 

/ 

/ 

K 

1 

+ 

- 

+ 

- 

- 

- 

+ 

+ 

+ 

- 

+ 

2 

+ 

+ 

- 

+ 

- 

- 

- 

+ 

+ 

+ 

- 

3 

- 

+ 

+ 

- 

+ 

- 

- 

- 

+ 

+ 

+ 

4 

+ 

- 

+ 

+ 

- 

+ 

- 

- 

- 

+ 

+ 

5 

+ 

+ 

- 

+ 

+ 

- 

+ 

- 

- 

- 

+ 

6 

+ 

+ 

+ 

- 

+ 

+ 

- 

+ 

- 

- 

- 

7 


+ 

4" 

+ 

- 

+ 

+ 

- 

+ 

- 

- 

8 

- 

- 

+ 

+ 

+ 

- 

+ 

4- 

. - 

+ 

- 

9 

- 

- 

- 

+ 

4" 

+ 

- 

+ 

4- 

- 

+ 

10 

+ 

- 

- 

- 

+ 

+ 

+ 

- 

+ 

4- 

- 

11 

- 

+ 

- 

- 

- 

+ 

+ 

+ 

- 

+ 

+ 

12 

— 

- 

- 

- 

— 

— 

- 

— 

- 

— 

- 
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a) Proyeccidn en tres factores 



6) Proyeccidn en cuatro factores 


Figura 8-24 Proyeccidn del diseno de Plackett-Burman de 12 corridas 
en disenos de tres y cuatro factores. 


Las propiedades proyectivas de los disenos no geometricos de Plackett-Burman no son avasalladora- 
mente atractivas. Por ejemplo, considere el diseno de 12 corridas de la tabla 8-24. Este diseno se proyecta- 
ra en tres replicas de un diseno 2 Z completo en dos cualesquiera de los 1 1 factores originales. Sin embargo, 
en tres factores, el diseno proyectado es un diseno 2 3 completo mas un factorial fraccionado 2 3 " 1 (ver la fi- 
gura 8-24a). Por lo tanto, el diseno de Plackett-Burman de resolucidn III tiene proyectividad 3, lo cual sig- 
nifica que se plegara en un diseno factorial completo en cualquier subconjunto de tres factores. El diseno 
2^ p s61o tiene proyectividad 2. Las proyecciones de cuatro dimensiones se muestran en la figura 8-24b. 
Observe que estas proyecciones de tres y cuatro factores no son disenos balanceados. 

EJEMPLO 8-8 

Se ilustrar^n algunas de las dificultades potenciales asociadas con los disenos de Plackett-Burman utili- 
zando el diseno de 11 variables con 12 corridas y un conjunto de datos simulados. Se supondra que el pro- 
ceso tiene tres efectos principales significativos (A, B, D ) y dos interacciones significativas de dos factores 
(AB y AD). El modelo es 

y= 200 + 8 *:! + 10 jc 2 + 12 x 4 - 12 *j * 2 + 9 ^X 4 +e 

donde cada x i es una variable codificada definida en el intervalo -1, +1 y e es un ttinnino NID(0, 9) del 
error aleatorio. Por lo tanto, tres de los k = 11 factores son grandes, y hay dos interacciones grandes; la si- 
tuacion no cst,i fuera de razon. 

En la tabla 8-25 se presenta el diseno de Plackett-Burman con 12 corridas y las respuestas simuladas. 
Este diseno luce diferente al diseno de 12 corridas de la tabla 8-24 porque se construyd utilizando el ren- 
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Tabla 8-25 Diseno de Plackett-Burman para el ejemplo 8-8 


Corrida 

A 

B 

C 

D 

E 

F 

G 

H 

J 

K 

L 

Respuesta 

1 

+ 

+ 

- 

+ 

+ 

+ 

- 

— 

- 

+ 

— 

231 

2 

- 

+ 

+ 

- 


+ 

+ 

- 

- 

- 

+ 

207 

3 

+ 

- 


+ 

- 

+ 

+ 

+ 

- 

- 

- 

230 

4 

- 

+ 

- 

+ 

+ 

- 

+ 

+ 

+ 

- 

- 

217 

5 

- 

- 

+ 

- 

+ 

+ 

- 

+ 

+ 

+ 

- 

175 

6 

- 

- 

- 

+ 

- 

+ 

+ 

- 

+ 

+ 

+ 

176 

7 

+ 

- 

- 

- 

+ 

- 

+ 

+ 

- 

+ 

+ 

183 

8 

+ 

+ 

- 

- 

- 

+ 

- 

+ 

+ 

- 

+ 

185 

9 

+ 

+ 

+ 

- 

- 

- 

+ 

- 

+ 

+ 

- 

181 

10 

- 

+ 

+ 

+ 

- 

- 

- 

+ 

- 

+ 

+ 

220 

11 

+ 

- 

+ 

+ 

+ 

- 

- 

- 

+ 

- 

+ 

229 

12 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

168 


glon de signos para k = 11, N = 12 de la tabla 8-23 como rengldn. En la tabla 8-26 se muestran las estima- 
ciones de los efectos. Observe que hay siete efectos grandest, B, C, D, E, JyK(y, dqsde luego, sus alias). 
No es evidente de inmediato que algunos de estos efectos podrfan ser interacciones. Parte de esta a m bi- 
giiedad podria resolverse haciendo el doblez del diseno. Con esto por lo general se resolverAn los efectos 
principales, pero con frecuencia sigue dejando al experimentador con la incertidumbre acerca de los efec- 
tos de las interacciones. 


La dificultad para interpretar un diseno de Plackett-Burman, ilustrada en el ejemplo anterior, ocurre 
con mucha frecuencia en la practica. Si la eleccidn esta entre un diseno geometrico con 16 corridas o 
un diseno de Plackett-Burman con 12 corridas que quiza tenga que doblarse (para lo cual se requerirfan 
24 corridas), el diseno geometrico puede resultar una mejor election. Para mayores detalles ver Montgo- 
mery, Borror y Stanley [81]. Bajo ciertas condiciones, los alias de un diseno no geometrico de Plac- 


Tabla 8-26 Estimaciones de los efectos, coeficientes de regresidn y sumas de cuadrados del ejemplo 8-8 


Variable 0 

Coeficiente de regresidn 

Efecto estimado 

Suma de cuadrados 

Promedio global 

200.167 



A 

6.333 

12.667 

481.333 

B 

6.667 

13.333 

533.333 

C 

6.833 

12.667 

560.333 

D 

17.000 

34.000 

3468.000 

E 

6.833 

13.667 

560.333 

F 

0.500 

1.000 

3.000 

G 

-1.167 

-2.333 

16.333 

H 

1.500 

3.000 

27.000 

J 

-6.333 

-12.667 

481.333 

K 

-5.833 

-11.667 

408.333 

L 

-0.167 

-0.333 

0.333 


“Todos los efectos principales son alias parciales de 45 interacciones de dos factores. 
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kett-Bunnan pueden desenredarse utilizando tdcnicas de construccidn de modelos de regresion. Esto se 
analiza en Hamada y Wu [53]. 


8-6 DISENOS DE RESOLUCION IV YV 


Un diseno factorial fraccionado 2 k ^ es de resolucidn IV si los efectos principales estan separados de las 
interacciones de dos factores y algunas interacciones de dos factores son alias entre si. Por lo tanto, si se 
suprimen las interacciones de tres factores y de drdenes superiores, los efectos principales pueden esti- 
marse directamente en un diseno 2 k ~ p . Un ejemplo es el diseno 2^ 2 de la tabla 8-10. Ademfis, las dos 
fracciones combinadas del diseno 2^ 4 del ejemplo 8-7 producen un diseno 2 7 ^ 3 . 

Cualquier diseno 2\^ p debe incluir al menos 2k corridas. A los disenos de resolution IV que contie- 
nen exactamente 2k corridas se les llama disenos mmimos. Los disenos de resolucion IV pueden obte- 
nerse a partir de disenos de resolucion III por el proceso de doblado. Recuerde que para hacer el doblez 
de un diseno 2^ p , simplemente se agrega a la fraccidn original una segunda fraction con todos los sig- 
nos invertidos. Entonces los signos positivos en la columna identidad I de la primera fractidn podrian 
intercambiarse en la segunda fraction, y el factor (k + l)-6simo podria asociarse con esta columna. El 
resultado es un diseno factorial fraccionado 2^ 1-p . El proceso se muestra en la tabla 8-27 para el diseno 
2^\ Es sencillo verificar que el diseno resultante es un diseno 2^' con la relacidn de definicidn 
I = ABCD. 

Tambien es posible hacer el doblez de disenos de resolution IV para separar las interacciones de dos 
factores que son alias entre si. Montgomery y Runger [83c] hacen notar que un experimentador puede te- 
ner varios objetivos al hacer el doblez de un diseno de resolucion IV, como 1) romper tantas cadenas de 
alias de interacciones de dos factores como sea posible, 2) romper las interacciones de dos factores en una 
cadena dc alias espetifica, o 3) romper las interacciones de dos factores que incluyen un factor especifico. 
Una manera de hacer el doblez de un diseno de resolution IV es corriendo una segunda fraction en la que 
se invierte el signo de todos los generadores del diseno que tienen un numero impar de letras. Para ilus- 
trar, considere el diseno 2^ 2 usado en el experimento del moldeo por inyeccidn del ejemplo 8-4. Los ge- 
neradores del diseno de la tabla 8-10 son I = ABCE e / = BCDF. La segunda fraccidn usaria los 


Tabla 8-27 Disefio 2^ obtenido por doblez 
D 

I_ A B C 

Diseno 2 3 m l orginal con I = ABC 

+ - + 
+ + 

+ - + 

+ + + + 


Segundo disefio 2^' con los signos intercambiados 


+ 


+ 

+ 


+ 

+ 
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generadores / = -ABCE e I = - BCDF y el generador unico para el diseno combinado seria 1 = ADEF. 
Por lo tanto, el diseno combinado sigue siendo un diseno factorial fraccionado de resolucidn IV. Sin em- 
bargo, las relaciones de los alias ser&n mucho m&s sencillas que en el diseno 2^ 2 original, De hecho, las 
unicas interacciones de dos factores que tendr&n alias sonALD = EF } AE = DFyAF = DE. Todas las de- 
nies interacciones de dos factores pueden estimarse a partir del diseno combinado, 

Como otro ejemplo, considere el diseno 2^ 3 con 32 corridas. La tabla 8-14 indica que el mejor con- 
junto de generadores para este diseno es I = ABCF } I = ABDG el = BCDEH . En la tabla XII(m) del 
apendice se muestran los alias para este diseno. Observe que hay seis pares de interacciones de dos facto- 
res y un grupo de tres interacciones de dos factores que son alias. Si se hace el doblez de este diseno, la se- 
gunda fraccidn tendria los generadores / = - ABCE I = -ABDG e I = BCDEH. El diseno combinado tiene 
los generadores I = CDFG e / = BCDEH , y la relacidn de definition completa es 


/= CDFG= BCDEH- BEFGH 


El diseno combinado es de resolution IV, pero las unicas interacciones de dos factores que siguen tenien- 
do alias son CD = FG, CF = DG y CG = DF. Se trata de una simplification considerable de los alias de la 
fraction original. 

Observe que cuando se empieza con un diseno de resolucidn III, el procedimiento de doblez garanti- 
za que el diseno combinado sera de resolution IV, con lo cual se asegura que todos los efectos principales 
pueden separarse de sus alias en interacciones de dos factores. Cuando se hace el doblez de un diseno de 
resolucidn IV, no necesariamente se separar£n todas las interacciones de dos factores. De hecho, si la 
fraction original tiene una estructura de los alias con mas de dos interacciones de dos factores en cual- 
quier cadena de alias, el doblez no separard completamente todas las interacciones de dos factores. 
Ambos ejemplos anteriores, el 2\~ l y el , tienen al menos una de tales cadenas de alias de interaccio- 
nes de dos factores. Montgomery y Runger [83c] dan una tabla de disenos hechos doblez recomendados 
para fracciones de resolucidn IV con 6 < k < 10 factores. 

Los disenos de resolution V son factoriales fraccionados en los que los efectos principales y las in- 
teracciones de dos factores no tienen como alias otros efectos principales u otras interacciones de dos fac- 
tores. Estos disenos son muy poderosos, permitiendo la estimation unica de todos los efectos principales 
y las interacciones de dos factores, siempre que todas las interacciones de tres factores y de ordenes supe- 
riors sean insignificantes. La palabra mas pequena de la relacidn de definition de tal diseno debe tener 
cinco letras. El diseno 2 5 " 1 con la relatidn de definicidn/ = ABCDE es de resolucidn V. Otro ejemplo es el 
diseno 2y -2 con las relaciones de definicidn/ = ABCDG el — ABEFH. Ejemplos adicionales de estos di- 
senos se presentan en Box y Hunter [17c]. 

Debido a que los disenos est£ndar de resolucidn V son disenos grandes cuando el numero de factores 
es moderadamente grande, existe cierto interes pr£ctico en los disenos factoriales fraccionados irregula- 
rs de resolucidn V. Se cuenta con disenos utiles para 4 < k < 9 factores. El diseno de 24 corridas para 
k = 5 factores se muestra en la tabla 8-28, Puesto que se trata de un diseno de resolucidn V, es posible esti- 
mar los cinco efectos principales y las 10 interacciones de dos factores, suponiendo que las interacciones 
de tres factors y ordenes superiors son insignificantes. El diseno para k = 4 factores tiene 12 corridas y 
se comenta en el problema 8-22. Para k = 6, 7 y 8, estos disenos tienen 48 corridas, y el diseno de nueve 
factores tiene 96 corridas. El paquete de software Design-Expert contiene todos estos disenos. 

Por ultimo, cabe sehalar que un doblez completo de un diseno de resolucidn IV o V suele ser innece- 
sario. En general, solo hay una o dos (o muy pocas) interacciones con alias que son de interes potential. 
Los alias de estas interacciones pueden por lo general separarse agre gando un numero pequeno de corri- 
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labia 8-28 La fracci6n irregular de 

resolucidn V para cinco factores 
en 24 corridas 
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das a la fraction original. Esta tecnica se denomina en ocasiones doblez parcial. Para formarse una idea 
de c6mo se hace esto, referirse al ejemplo 10-5 y al material suplementario del texto de este capitulo. 


8-7 RESUMEN 

En este capitulo se introdujo el diseno factorial fraccionado 2* _p . Se ha hecho hincapi6 en el uso de estos 
disehos en experimentos de tamizado para identificar de manera r&pida y eficaz el subconjunto de facto- 
res que est;in activos, asi como para proporcionar cierta information sobre las interacciones. La propie- 
dad de proyeccidn de estos disehos hace posible en muchos casos examinar los factores activos con mayor 
detalle. El ensamblaje secuencial de estos disehos por medio de un doblez es una manera muy eficaz de 
obtener informacidn adicional acerca de las interacciones que pueden identificarse como de posible im- 
portancia en un experimento inicial. 

En la practica, los disehos factoriales fraccionados 2 fc_p con N = 4, 8, 16 y 32 corridas son muy utiles. 
En la tabla 8-29 se resumen estos disehos, identificando cu&ntos factores pueden usarse con cada diseno 
para obtener diferentes tipos de experimentos de tamizado. Por ejemplo, el diseno de 16 corridas es un 
factorial completo para 4 factores, una fraccidn un medio para 5 factores, una fraccidn de resolucidn IV 
para 6 u 8 factores y una fraccidn de resolucidn III para 9 a 15 factores. Tbdos estos disehos pueden cons- 
truirse utilizando los m6todos explicados en este capitulo, y muchas de sus estructuras de los alias se 
muestran en la tabla XII del apendice. 
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Tabla 8-29 Disefios factoriales y factoriales fraccionados utiles del 


sistema 2*H». Los numeros en las celdas son el numero 
de factores del experimento 


Tipo de diseno 

4 

Numero de corridas 

8 16 32 

Factorial completo 

2 

3 

4 

5 

Fraccidn un medio 

3 

4 

5 

6 

Fraccidn de resolucidn IV 

— 

4 

6-8 

7-16 

Fraccidn de resolucidn III 

3 

5-7 

9-15 

17-31 


8-8 PROBLEMAS 

8-1. Suponga que en el experimento del desarrollo del proceso quimico descrito en el problema 6-7 sdlo pudo co- 
rrerse una fraccidn un medio del diseno 2 4 . Construir el diseno y llevar a cabo el andlisis estadistico utilizando 
los datos de la rdplica I. 

8-2. Suponga que en el problema 6-15 sdlo pudo correrse una fraccidn un medio del diseno 2 4 . Construir el diseno 
y llevar a cabo el andlisis utilizando los datos de la replica I. 

8-3. Considere el experimento del grabado con plasma del problema 6-18. Suponga que sdlo pudo correrse una 
fraccidn un medio del diseno. Establecer el diseno y analizar los datos. 

8-4. En el problema 6-21 se describe el estudio para mejorar un proceso durante la manufactura de un circuito in- 
tegrado. Suponga que sdlo pudieron hacerse ocho corridas de este proceso. Establecer un diseno 2 5 - 2 apro- 
piado y encontrar la estructura de los alias. Utilizar las observaciones apropiadas del problema 6-21 como las 
observaciones de este diseno y estimar los efectos de los factores. 6Qu6 conclusiones pueden sacarse? 

8-5. Continuacidn del problema 8-4 . Suponga que ha hecho las ocho corridas del diseno 2 5 2 del problema 8-4. 
6 Qu£ corridas adicionales se necesitarfan para identificar los efectos de los factores que son de interds? 
£Cu£les son las relaciones de los alias en el diseno combinado? 

8-6. R.D. Snee (“Experimentacidn con un numero grande de variables”, en Experiments in Industry: Design , 
Analysis and Interpretation of Results, de R.D. Snee, L.B. Hare y J.B. Trout, editores, ASQC) describe un ex- 
perimento en el que se usd un diseno 2 s ~ l con / =-ABCDE para investigar los efectos de cinco factores sobre 
el color de un producto quimico. Los factores sonyl - solvente/reactivo, B = catalizador/reactivo, C = tem- 
peratura ,D = pureza del reactivo y E = pH del reactivo. Los resultados obtenidos fueron los siguientes: 


e — 

-0.63 

d =6.79 

a = 

2.51 

ade = 5.47 

b = 

-2.68 

bde — 3.45 

abe = 

1.66 

abd = 5.68 

c = 

2.06 

ede = 5.22 

ace = 

1.22 

acd = 4.38 

bee = 

-2.09 

bed = 4.30 

abc = 

1.93 

abede = 4.05 


a) Construir una gr&fica de probabilidad normal de los efectos. LQu6 efectos parecen estar activos? 

b ) Calcular los residuales. Construir una gr&fica de probabilidad normal de los residuales y graficar los resi- 
duales contra los valores ajustados. Comentar las gr^ficas. 

c) Si algunos de los factores son insignificantes, plegar el diseno 2 s 1 a un diseno factorial completo en los 
factores activos. Comentar el diseno resultante e interpretar los resultados. 

8-7. En un articulo de J J. Pignatiello, Jr. y J.S. Ramberg del Journal of Quality Technology (vol. 17, pp. 198-206) se 
describe el uso de un diseno factorial fraccionado con rdplicas para investigar el efecto de cinco factores so- 
bre la altura libre de los resortes de hojas utilizados en una aplicacidn automotriz. Los factores son A - tern- 
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peratura del homo, B - tiempo de calentamiento, C - tiempo de transference, D = tiempo de retencidn y 
E = temperatura del aceite de templado. Los datos se presentan a continuacidn: 


A 

B 

c 

D 

E 


Altura libre 



— 

_ 

— 

— 

7.78 

7.78 

7.81 


* - 

— 

+ 

— 

8.15 

8.18 

7.88 

- 

+ 

- 

+ 

- 

7.50 

7.56 

7.50 

+ 

+ 

_ 

_ 

_ 

7.59 

7.56 

7.75 

- 


+ 

+ 

- 

7.54 

8.00 

7.88 

+ 

- 

-1- 

- 

- 

7.69 

8.09 

8.06 

— 

+ 

+ 

- 

- 

7.56 

7.52 

7.44 

+ 

+ 

+ 

+ 

- 

7.56 

7.81 

7.69 

- 

- 

- 

- 

+ 

7.50 

7.25 

7,12 

+ 

_ 

- 

+ 

+ 

7,88 

7.88 

7,44 

- 

+ 

- 

+ 

+ 

7.50 

7.56 

7.50 

+ 

+ 

- 

- 

+ 

7.63 

7.75 

7.56 

- 

- 

+ 

+ 

+ 

7.32 

7.44 

7.44 

+ 

- 

+ 

- 

+ 

7.56 

7.69 

7.62 

- 

+ 

+ 

- 

+ 

7.18 

7.18 

7.25 

+ 

+ 

+ 

+ 

+ 

7.81 

7.50 

7.59 


a) Escribir la estructura de los alias de este diseno. LQu6 resolucidn tiene este diseno? 

b) Analizar los datos. LQu6 factores influyen en la altura libre promedio? 

c) Calcular el rango y la desviacidn estdndar de la altura libre para cada corrida. £Hay algun indicio de que 
cualquiera de estos factores afecta la variabilidad de la altura libre? 

d) Analizar los residuales de este experimento y comentar los resultados. 

e) 6Este diseno es el mejor posible para cinco factores en 16 corridas? Especfficamente, le s posible encon- 
trar un diseno fraccionado para cinco factores en 16 corridas con una resolucidn m&s alta que la de este 
diseno? 

8-8. En un articulo de Industrial and Engineering Chemistry (“Informacidn adicional acerca de la planeacidn de 
experimentos para aumentar la eficiencia de la investigacidn”) se utiliza un diseno 2 5 ~ 2 para investigar el efec- 
to de^4 — temperatura de condensacidn, B - cantidad del material 1, C = volumen del solvente, D = tiempo 
de condensacidn y E = cantidad del material 2 sobre el rendimiento, Los resultados obtenidos son los si- 
guientes: 


e = 23,2 ad =16.9 cd = 23.8 tae=16,8 

ab = 15.5 be = 16.2 ace = 23 A abede =18.1 

a) Verificar que los generadores que se utilizaron en el diseno fueron I = ACE e I - BDE. 

b) Apuntar la relacidn de definicidn completa y los alias de este diseno. 

c) Estimar los efectos principales. 

d) Elaborar la tabla del an&lisis de varianza. Verificar que las interaccionesyl# y AD est&n disponibles para 
usarlas como error. 

e) Graficar los residuales contra los valores ajustados. Construir tambi6n la grdfica de probabilidad normal 
de los residuales. Comentar los resultados. 

8-9. Considere el experimento con el resorte de hojas del problema 8-7. Suponga que el factor^ (temperatura del 
aceite de templado) es muy dificil de controlar durante la manufactura, seria el ajuste de los factores 
A, B,CyD para reducir la variabilidad de la altura libre tanto como sea posible, independientemente de la 
temperatura del aceite de templado usada? 

8- 1 0. Construir un diseno 2 7 2 seleccionando dos interacciones de dos factores como los generadores independien- 
tes. Apuntar la estructura de los alias completa de este diseno. Delinear la tabla del andlisis de varianza. 
£Cu41 es la resoluci6n de este diseno? 
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8-11, Considere el disefio 2 s del problema 6-21, Suponga que sdlo pudo correrse una fraccidn un medio. Ademds 
se requirieron dos dias para hacer las 16 observaciones, y fue necesario confundir el disefio 2 5 - 1 en dos blo- 
ques, Construir el diseno y analizar los datos, 

8-12. Analizar los datos del problema 6-23 como si provinieran de un diseno 2\y con I — ABCD. Proyectar el dise- 
no en un factorial completo en el subconjunto de los cuatro factores originales que parecen ser significative s. 

8-13. Repetir el problema 8-12 utilizando I = -ABCD. 2E1 uso de la fraccidn alterna modifica la interpretacidn de 
los datos? 

8-14. Proyectar el disefio 2 del ejemplo 8-1 en dos rdplicas de un disefio 2 2 en los factores A y B . Analizar los da- 
tos y sacar conclusiones. 

8-15. Construir un diseno 2^ 3 . Determinar los efectos que pueden estimarse si se corre una segunda fraction de 
este diseno con todos los signos invertidos. 

8-16. Considere el disefio 2^ 3 del problema 8-15, Determinar los efectos que pueden estimarse si se corre una se- 
gunda fraccidn de este diseno con los signos del factor A invertidos. 

8-17. Hacer el doblez del disefio 2 de la tabla 8-19 para producir un diseno de ocho factores. Verificar que el di- 
seno resultante sea 2^\ LSe trata de un disefio mfnimo? 

8-18. Hacer el doblez de un disefio 2^ 2 para producir un disefio de seis factores. Verificar que el disefio resultante 
sea 2^ 2 . Comparar este disefio con el diseno 2j^ 2 de la tabla 8-10, 

8-19. Un ingeniero industrial realiza un experimento utilizando un modelo de simulation Montecarlo de un siste- 
ma de inventario. Las variables independientes de su modelo son la cantidad del pedido (/l), el punto de un 
nuevo pedido ( B ), el costo de organization (C), el costo del refrendo de pedidos (D) y la tarifa de transporta- 
tion ( E ). La variable de respuesta es el costo anual promedio. Para ahorrar tiempo de computadora, el inge- 
niero decide investigar estos factores utilizando un diseno 2^ 2 con I = ABD e / = BCE , Los resultados que 
obtiene son de = 95, ae - 134, b - 158, abd = 190, cd = 92, ac = 187, bee = 155 y abede = 185. 

a) Verificar que las combinaciones de tratamientos dadas sean correctas. Estimar los efectos suponiendo 
que las interacciones de tres factores y de Ordenes superiores son insignificantes. 

b) Suponga que se agrega una segunda fraction a la primera, por ejemplo, ade « 136, e = 93, ab = 187, bd = 
153, acd = 139, c - 99, abce = 191 y bade - 150. 6C0mo se obtuvo esta segunda fraction? Incorporar es- 
tos datos a la fracciOn original y estimar los efectos. 

c) Suponga que se corriO la fracciOn abc - 189, ce = 96, bed = 154, aede = 135, abe = 193, bde = 152, ad = 
137 y (1) = 98. LC6mo se obtuvo esta fracciOn? Incorporar estos datos en la fracciOn original y estimar 
los efectos. 

8-20. Construir un disefio 2 5 ^. Indicar cOmo puede correrse el diseno en dos bloques de ocho observaciones cada 
uno. i,Alguno de los efectos principales o de las interacciones de dos factores est&n confundidos con los blo- 
ques? 

8-21. Construir un disefio 2 7-2 . Indicar edmo puede correrse el disefio en cuatro bloques de ocho observaciones 
cada uno. LAlguno de los efectos principales o de las interacciones de dos factores est&n confundidos con los 
bloques? 

8-22. Fracciones irregulares del disefio 2 k (John [61d]). Considere un diseno 2 4 . Tienen que estimarse los cuatro efec- 
tos principales y las seis interacciones de dos factores, pero no puede correrse el factorial 2 4 completo. El ta- 
mafio del bloque m&s grande posible contiene 12 corridas. Estas 12 corridas pueden obtenerse de las cuatro 
replicas un cuarto definidas por I = ±AB = ±ACD - ±BCD omitiendo la fraccidn principal. Indicar edmo 
pueden combinarse las tres fracciones 2^ 2 restantes para estimar los efectos requeridos, suponiendo que las 
interacciones de tres factores y de drdenes superiores son insignificantes. Este disefio podrfa considerate 
como una fraccidn tres cuartos. 

8-23. Los dnodos de carbono utilizados en un proceso de fundicidn se fabrican en un homo anular. Se corre un ex- 
perimento en el homo para determinar curies son los factores que influyen en el peso del material de empa- 
que que se adhiere a los dnodos despuds de la coccidn. Seis variables son de interes, cada una con dos niveles: 
A = relacidn paso/finos (0.45, 0,55 ), B = tipo de material de empaque(l,2),C = temperatura del material de 
empaque (ambiente, 325°C), D = localizacidn de la chimenea (adentro, afuera), E — temperatura del foso 
(ambiente, 195°C) y F = tiempo de retraso antes del empaque (cero, 24 horas). Se corre un diseno 2 s - 3 y se 
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obtienen tres replicas en cada uno de los puntos del diseno* El peso del material de empaque adherido a los 
Inodos se mide en gramos. Los datos en el orden de las corridas son los siguientes: abd = (984, 826, 936); 
abcdef = (1275, 976, 1457); be = (1217, 1201, 890); af = (1474, 1164, 1541); def = (1320, 1156, 913); cd - 
(765, 705, 821); ace = (1338, 1254, 1294) y bcf= (1325, 1299, 1253). Se desea minimizar la cantidad de mate- 
rial de empaque adherido. 

a) Verificar que las ocho corridas correspondan a un diseho 2% l . 6Cu&l es la estructura de los alias? 

b) Usar el peso promedio como respuesta. £Qu6 factores parecen tener influencia? 

c) Usar el rango de los pesos como respuesta. 6Qu£ factores parecen tener influencia? 

d) 60ud recomendaciones podrian hacerse a los ingenieros del proceso? 

8-24. Se corrid un experimento de 16 corridas en una planta de manufactura de semiconductores para estudiar los 
efectos de seis factores sobre la curvatura o combadura de los dispositivos del sustrato producidos. Las seis 
variables y sus niveles se presentan a continuacidn: 


Corrida 

Tfemperatura de 
laminacidn 

(°C) 

Tiempo de 
laminacidn 
00 

Presidn de 
laminacidn 
(tn) 

Ibmperatura 
de coccidn 

(°C) 

Duracidn 
del ciclo de 
coccion 

(h) 

Punto de 
rocfo de 
la coccidn 

(°C) 

1 

55 

10 

5 

1580 

17.5 

20 

2 

75 

10 

5 

1580 

29 

26 

3 

55 

25 

5 

1580 

29 

20 

4 

75 

25 

5 

1580 

17.5 

26 

5 

55 

10 

10 

1580 

29 

26 

6 

75 

10 

10 

1580 

17.5 

20 

7 

55 

25 

10 

1580 

17.5 

26 

8 

75 

25 

10 

1580 

29 

20 

9 

55 

10 

5 

1620 

17.5 

26 

10 

75 

10 

5 

1620 

29 

20 

11 

55 

25 

5 

1620 

29 

26 

12 

75 

25 

5 

1620 

17.5 

20 

13 

55 

10 

10 

1620 

29 

20 

14 

75 

10 

10 

1620 

17.5 

26 

15 

55 

25 

10 

1620 

17.5 

20 

16 

75 

25 

10 

1620 

29 

26 


Se hicieron cuatro rgplicas de cada corrida, y se hizo una medicidn de la combadura del sustrato. Los datos se 
presentan enseguida: 


Combadura por replica (pulg/pulg) M Media Desviacion 


Corrida 

1 

2 

3 

4 

(10- 4 pulg/pulg) 

(10- 4 pulg/pulg) 

est&ndar 

1 

0.0167 

0.0128 

0.0149 

0.0185 

629 

157.25 

24.418 

2 

0.0062 

0.0066 

0.0044 

0.0020 

192 

48.00 

20.976 

3 

0.0041 

0.0043 

0.0042 

0.0050 

176 

44.00 

4.083 

4 

0.0073 

0.0081 

0.0039 

0.0030 

223 

55.75 

25.025 

5 

0.0047 

0.0047 

0.0040 

0.0089 

223 

55.75 

22.410 

6 

0.0219 

0.0258 

0.0147 

0.0296 

920 

230.00 

63.639 

7 

0.0121 

0.0090 

0.0092 

0.0086 

389 

97.25 

16.029 

8 

0.0255 

0.0250 

0.0226 

0.0169 

900 

225.00 

39.42 

9 

0.0032 

0.0023 

0.0077 

0.0069 

201 

50.25 

26,725 

10 

0.0078 

0.0158 

0.0060 

0.0045 

341 

85.25 

50.341 
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Combadura por replica (pulg/pulg) 

Tbtal 

Media 

Desviacidn 

Corrida 

1 

2 

3 

4 

(1(H pulg/pulg) 

(1(H pulg/pulg) 

estdndar 

11 

0.0043 

0.0027 

0.0028 

0.0028 

126 

31.50 

7.681 

12 

0.0186 

0.0137 

0.0158 

0.0159 

640 

160.00 

20.083 

13 

0.0110 

0.0086 

0.0101 

0.0158 

455 

113.75 

31.12 

14 

0.0065 

0.0109 

0.0126 

0.0071 

371 

92.75 

29.51 

15 

0.0155 

0.0158 

0.0145 

0.0145 

603 

150.75 

6.75 

16 

0.0093 

0.0124 

0.0110 

0,0133 

460 

115.00 

17.45 


a) 6Qu£ tipo de diseno utilizaron los experimentadores? 

b) 6Cu£les son las relaciones de los alias en este diseno? 

c ) 2Alguna de las variables del proceso afecta la combadura promedio? 

d) 6Alguna de las variables del proceso afeeta la variabilidad de las mediciones de la combadura? 


Tabla 8-30 Datos para el problema 8-25 


Corrida 

A 

Volumen 

B 

Lote 

C 

Tiempo, s 

D 

Velocidad 

E 

Aceleracidn 

F 

Cubierta 

Espesor del recubrimiento protector 
Izq, Centro Der. Prom. Rango 

1 

5 

Lote2 

14 

7350 

5 

Sin 

4531 

4531 

4515 

4525.7 

16 

2 

5 

Lote 1 

6 

7350 

5 

Sin 

4446 

4464 

4428 

4446 

36 

3 

3 

Lote 1 

6 

6650 

5 

Sin 

4452 

4490 

4452 

4464.7 

38 

4 

3 

Lote 2 

14 

7350 

20 

Sin 

4316 

4328 

4308 

4317.3 

20 

5 

3 

Lote 1 

14 

7350 

5 

Sin 

4307 

4295 

4289 

4297 

18 

6 

5 

Lote 1 

6 

6650 

20 

Sin 

4470 

4492 

4495 

4485.7 

25 

7 

3 

Lote 1 

6 

7350 

5 

Con 

4496 

4502 

4482 

4493.3 

20 

8 

5 

Lote 2 

14 

6650 

20 

Sin 

4542 

4547 

4538 

4542.3 

9 

9 

5 

Lote 1 

14 

6650 

5 

Sin 

4621 

4643 

4613 

4625.7 

30 

10 

3 

Lote 1 

14 

6650 

5 

Con 

4653 

4670 

4645 

4656 

25 

11 

3 

Lote 2 

14 

6650 

20 

Con 

4480 

4486 

4470 

4478.7 

16 

12 

3 

Lote 1 

6 

7350 

20 

Sin 

4221 

4233 

4217 

4223.7 

16 

13 

5 

Lote 1 

6 

6650 

5 

Con 

4620 

4641 

4619 

4626.7 

22 

14 

3 

Lote 1 

6 

6650 

20 

Con 

4455 

4480 

4466 

4467 

25 

15 

5 

Lote 2 

14 

7350 

20 

Con 

4255 

4288 

4243 

4262 

45 

16 

5 

Lote 2 

6 

7350 

5 

Con 

4490 

4534 

4523 

4515.7 

44 

17 

3 

Lote 2 

14 

7350 

5 

Con 

4514 

4551 

4540 

4535 

37 

18 

3 

Lote 1 

14 

6650 

20 

Sin 

4494 

4503 

4496 

4497.7 

9 

19 

5 

Lote 2 

6 

7350 

20 

Sin 

4293 

4306 

4302 

4300.3 

13 

20 

3 

Lote 2 

6 

7350 

5 

Sin 

4534 

4545 

4512 

4530.3 

33 

21 

5 

Lote 1 

14 

6650 

20 

Con 

4460 

4457 

4436 

4451 

24 

22 

3 

Lote 2 

6 

6650 

5 

Con 

4650 

4688 

4656 

4664.7 

38 

23 

5 

Lote 1 

14 

7350 

20 

Sin 

4231 

4244 

4230 

4235 

14 

24 

3 

Lote 2 

6 

7350 

20 

Con 

4225 

4228 

4208 

4220.3 

20 

25 

5 

Lote 1 

14 

7350 

5 

Con 

4381 

4391 

4376 

4382.7 

15 

26 

3 

Lote 2 

6 

6650 

20 

Sin 

4533 

4521 

4511 

4521.7 

22 

27 

3 

Lote 1 

14 

7350 

20 

Con 

4194 

4230 

4172 

4198.7 

58 

28 

5 

Lote 2 

6 

6650 

5 

Sin 

4666 

4695 

4672 

4677.7 

29 

29 

5 

Lote 1 

6 

7350 

20 

Con 

4180 

4213 

4197 

4196.7 

33 

30 

5 

Lote 2 

6 

6650 

20 

Con 

4465 

4496 

4463 

4474.7 

33 

31 

5 

Lote 2 

14 

6650 

5 

Con 

4653 

4685 

4665 

4667.7 

32 

32 

3 

Lote 2 

14 

6650 

5 

Sin 

4683 

4712 

4677 

4690.7 

35 
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e ) Si es importante reducir la combadura tanto como sea posible, £qu£ recomendaciones se harian? 

8-25 . Se usa un revestimien to por centrifugado para aplicar un recubrimien to f otoprotector en una oblea de silicio 
natural. Esta operation suele hacerse en las fases iniciales del proceso de fabrication de semiconductores, y 
el espesor promedio del recubrimiento protector y la variabilidad del espesor del mismo tienen un impacto 
importante en los pasos subsecuentes de manufactura. Seis variables se usan en el experimento. Las varia- 
bles y sus niveles alto y bajo se presentan a continuation: 


Factor 

Nivel bajo 

Nivel alto 

Velocidad de centrifugado final 

7350 rpm 

6650 rpm 

Indice de aceleraciOn 

5 

20 

Volumen de recubrimiento protector aplicado 

3 cc 

5 cc 

Tiempo del centrifugado 

14 s 

6 s 

Variation del lote del recubrimiento protector 

Lote 1 

Lote 2 

Presion de descarga 

Sin cubierta 

Con cubierta 


El experimentador decide usar un diseno 2 6- * y hacer tres lecturas del espesor del recubrimiento protector en 
cada oblea de prueba. Los datos se muestran en la tabla 8-30. 

a) Verificar que se trata de un diseno 2 6 - 1 . Discutir las relaciones de los alias de este diseno. 

b) £Qu6 factores parecen afectar el espesor promedio del recubrimiento protector? 

c) Considerando que el volumen del recubrimiento protector aplicado tiene un efecto reducido sobre el es- 
pesor promedio, 6tiene esto alguna implication practica importante para los ingenieros del proceso? 

d) Proyectar este diseno en un diseno menor que incluya unicamente los factores significativos. Presentar 
los resultados gr&ficamente. ^Ayuda esto en la interpretation? 

e) Usar el rango del espesor del recubrimiento protector como variable de respuesta. 6Hay algun indicio de 
que alguno de estos factores afecte la variabilidad del espesor del recubrimiento protector? 

f) £D6nde se recomendarfa que corrieran el proceso los ingenieros? 

8-26, Harry y Judy Peterson-Nedry (dos amigos del autor) son propietarios de un vinedo y una f£brica vinicola en 
Newberg, Oregon, Cultivan varias variedades de uvas y fabrican vino. Harry y Judy han usado disenos facto- 
riales para el desarrollo de procesos y productos en el segmento de fabrication vinicola de su negocio. Este 
problema describe el experimento realizado para su Pinot Noir 1985. Originalmente se estudiaron ocho va- 
riables, las cuales se muestran en este experimento: 


Variable 

Nivel bajo (-) 

Nivel alto (+) 

A = Cion de Pinot Noir 

Pommard 

Wadenswil 

B = Tipo de roble 

Allier 

Tfonqais 

C = Edad de la barrica 

Vieja 

Nueva 

D = Levadura/contacto con la piel 

Champagne 

Montrachet 

E = Vapores 

Ninguno 

Todos 

F = Tostado de las barricas 

Ligero 

Medio 

G — Racimos completos 

Ninguno 

10% 

H = Temperatura de fermentacion 

Baja (75°F m^x.) 

Alta (92°F max.) 


Harry y Judy decidieron usar un diseno 2^ 4 con 16 corridas. El vino fue catado por un panel de expertos el 8 
de marzo de 1986. Cada experto calificO las 16 muestras de vino catadas, siendo la calificaciOn 1 la mejor. El 
diseno y los resultados del panel de catadores se muestra en la tabla 8-31, 

a) £Cu£les son las relaciones de los alias en el diseno seleccionado por Harry y Judy? 

b) Usar las calificaciones promedio (y) como variable de respuesta. Analizar los datos y sacar conclusiones. 
Se encontrari util examinar una gr&fica de probabilidad normal de las estimaciones de los efectos. 



qHb^^h ; r|oqQqio^h(N'nqrH 
g mcnNTHHi-Jr^ddtN^H^HTtH 

p/ ^OC^(NOOOM(NqOOOO^^N^ 

,5s a\dN^a\^^LA(Nr^tx}(NONN^(N 




a U o^-HO\coo^trinh(NHTt^^r] 

* t— ( t— ( *— I t— I i-H rH t— I 

Q> Q 

T5 

S ^ C^rtOt^Hin^\Om^tOOin(NrHO>(N 


t£j Qj t-H t-H t— ( ^ rH 


NO^ , 0N00'O\0i^Hi>nt^cs^t'O’-H 


I ttj * + + * I + + 1 + 1 1 + + 1 1 + 


KD I + + I + l l + I + + I + I I + 


&J 1 +I++I+I+I+I 1+1 + 


.« E hq ‘ I+ + + +I l++l l i l+ + 


Q l I I I I I I I+ + + + + + + + 


O I l I I+ + + +I l l I+ + + + 


« QQ l I++I I++I I++I I+ + 


O I+I+I+I+I+I+I+I + 

•d 


QO -3 

4 ‘E 

r Q 
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c) Usar la desviaci6n est£ndar de las calificaciones (o alguna transformacidn apropiada tal como log s) 
como variable de respuesta. i>Qu6 conclusiones pueden sacarse acerca de los efectos de las ocho varia- 
bles sobre la variabilidad de la calidad del vino? 

rf) Despuds de mirar los resultados, Harry y Judy coincidieron en que uno de los miembros del panel 
(DCM) sabia m£s de cerveza que de vino, por lo que decidieron eliminar su calificacidn. oQu 6 efecto 
tendria esto en los resultados y las conclusiones de los incisos bye? 

e) Suponga que justo antes de empezar el experimento, Harry y Judy se enteraron de que las ocho nuevas 
barricas que ordenaron de Francia para usarlas en el experimento no llegarian a tiempo, y que las 16 co- 
rridas tendrfan que hacerse con las barricas viejas. Si Harry y Judy simplemente eliminan la columna C 
de su diseno, iqu6 ocurre con las relaciones de los alias? <i.Es necesario que empiecen de nuevo y cons- 
truyan otro diseno? 

f) Harry y Judy saben por experiencia que es improbable que algunas de las combinaciones de tratamientos 
produzcan buenos resultados, Por ejemplo, la corrida con las ocho variables en el nivel alto generalmen- 
te resulta en un vino con una calificacibn baja. Hsto se confirmb el 8 de marzo de 1986 en la prueba del 
vino. Quieren establecer un nuevo diseno para su Pinot Noir 1986 utilizando estas mismas ocho varia- 
bles, pero no quieren correr el experimento con los ocho factor es en el nivel alto. 6Qud diseno sugeriria 
el lector? 

8-27. En un artfculo de Quality Engineering (“Una aplicacidn de los disenos experimentales factoriales fracciona- 
dos”, vol. 1, pp. 19-23) M B. Kilgo describe un experimento para determinar el efecto de la presidn del C0 2 
( A ), la temperatura del C0 2 ( B ), la humedad del cacahuate (C), la velocidad de flujo del C0 2 (D) y el tamano 
de las particulas de cacahuate (f?) sobre el rendimiento total del aceite por lote de cacahuates (y). Los niveles 
que usd para egtos factores son los siguientes: 


A, B, C , D, E, 

Nivel presidn temperatura humedad flujo tamano de las 

codifica do (bar) (°C) (% por peso) (litros/min) particulas (mm) 

~L 415 25 5~ 40 1-28 

1 550 95 15 60 405 


Kilgo realizd el experimento factorial fraccionado con 16 corridas que se muestra a continuacidn. 


A BCD E y 


415 

25 

5 

40 

1.28 

63 

550 

25 

5 

40 

4.05 

21 

415 

95 

5 

40 

4.05 

36 

550 

95 

5 

40 

1.28 

99 

415 

25 

15 

40 

4.05 

24 

550 

25 

15 

40 

1.28 

66 

415 

95 

15 

40 

1.28 

71 

550 

95 

15 

40 

4,05 

54 

415 

25 

5 

60 

4.05 

23 

550 

25 

5 

60 

1.28 

74 

415 

95 

5 

60 

1.28 

80 

550 

95 

5 

60 

4,05 

33 

415 

25 

15 

60 

1.28 

63 

550 

25 

15 

60 

4.05 

21 

415 

95 

15 

60 

4,05 

44 

550 

95 

15 

60 

1,28 

96 
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a) LQui tipo de disefio se ha utilizado? Identificar la relacidn de definicidn y las rclaciones de los alias. 

b) Estimar los efectos de los factores y usar una gr&fica de probabilidad normal para hacer la identificacidn 
tentativa de los factores importantes. 

c) Efectuar el andlisis estadfstico apropiado para probar las hipdtesis de que los factores identificados en el 
inciso b anterior tienen un efecto significativo sobre el rendimiento del aceite de cacahuate. 

d) Ajustar un modelo que pueda usarse para predecir el rendimiento del aceite de cacahuate en tdrminos 
de los factores que se han identificado como importantes. 

e) Analizar los residuales de este experimento y comentar la adecuacidn del modelo. 

8-28. Los ingenieros de la planta Essex Aluminum de Ford Motor Company llevaron a cabo un experimento facto- 
rial fraccionado en 10 factores con 16 corridas para el vaciado en arena de tubos multiples para motor, el cual 
se describe en el articulo “Estudio del proceso de vaciado evaporativo para multiples de admisidn de 3.0 li- 
tros ‘Poor SandfilT”, de D. Becknell ( Fourth Symposium on Taguchi Methods , American Supplier Institute, 
Dearborn, MI, pp. 120-130). El objetivo fue determinar cudles de los 10 factores tienen un efecto sobre la 
proporcidn de vaciados defectuosos. El diseno y la proporcidn resultante de vaciados no defectuosos p que 
se observaron en cada corrida se presentan enseguida. Se trata de una fraccidn de resolucidn III con genera- 
dores E = CD, F — BD f G = BC r H —AC, J = AB y K = ABC , Suponga que el numero de vaciados hechos en 
cada corrida del diseno es 1000. 


Corrida 

A 

B 

C 

D 

E 

F 

G 

H 

J 

K 

p 

arcsen yfp 

Modificacidn 
de F&T 

1 

- 

- 

- 

■ - 

+ 

+ 

+ 

+ 

+ 

- 

0.958 

1.364 

1.363 

2 

+ 

- 

- 

- 

+ 

+ 

+ 

- 

- 

+ 

1.000 

1.571 

1.555 

3 

- 

+ 

- 

- 

+ 

- 

- 

+ 

- 

+ 

0.977 

1.419 

1.417 

4 

+ 

+ 

- 

- 

+ 

- 

- 

- 

+ 

- 

0.775 

1,077 

1.076 

5 

- 

- 

+ 

- 

- 

+ 

- 

- 

+ 

+ 

0.958 

1.364 

1.363 

6 

+ 

- 

+ 

- 

-• 

+ 

- 

+ 

- 

- 

0.958 

1.364 

1.363 

7 

- 

+ 

+ 

- 

- 

- 

+ 

- 

- 


0.813 

1.124 

1.123 

8 

+ 

+ 

+ 

- 

- 

- 

+ 

+ 

+ 

+ 

0,906 

1.259 

1.259 

9 

- 

- 

- 

+ 


- 

+ 

+ 

+ 

- 

0.679 

0.969 

0.968 

10 

+ 

- 

- 

+ 

- 

- 

+ 

- 

- 

+ 

0.781 

1.081 

1.083 

11 

- 

+ 

- 

+ 

- 

+ 

- 

+ 

- 

+ 

1.000 

1.571 

1,556 

12 

+ 

+ 

- 

+ 

- 

+ 

- 

- 

+ 

- 

0.896 

1.241 

1.242 

13 

- 

- 

+ 

+ 

+ 

- 

- 

- 

+ 

+ 

0.958 

1.364 

1.363 

14 

+ 

- 

+ 

+ 

+ 

- 

- 

+ 

- 

- 

0.818 

1.130 

1.130 

15 

- 

+ 

+ 

+ 

+ 

+ 

+ 

- 

- 

- 

0.841 

1.161 

1.160 

16 

+ 

+ 

+ 

+ 

+ 

3- 

+ 

+ 

+ 

3- 

0.955 

1.357 

1.356 


a) Encontrar la relacidn de definicidn y las relaciones de los alias de este diseno. 

b) Estimar los efectos de los factores y usar una grdfica de probabilidad normal para hacer la identificacidn 
tentativa de los factores importantes. 

c) Ajustar el modelo apropiado utilizando los factores identificados en el inciso b anterior. 

, d) Graficar los residuales de este modelo contra la proporcidn predicha de vaciados no defectuosos. Cons- 
truir tambidn una gr&fica de probabilidad normal de los residuales. Comentar la adecuacidn de estas gr&- 
ficas. 

e) El lector habr£ notado en el inciso d un indicio de que la varianza de la respuesta no es constante (consi- 
derando que la respuesta es una proportion, esto deberfa haberse anticipado). La tabla anterior tambidn 
muestra una transformation de p, arcsen de la rafz cuadrada de p , que es de uso generalizado como 
transformacidn para estabilizar la varianza de los datos de la proportion (referirse a la discusi6n de las 
transformaciones para estabilizar la varianza del capftulo 3). Repetir los incisos a aid anteriores utilizan- 
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do la respuesta transformada y comentar los resultados. Espetificamente, ison mejores ahora las gr&fi- 
cas de los residuales? 

f) Hay una modification de la transformation aresen de la raiz cuadrada, propuesta por Freeman y Tiikey 
(“Transformaciones relacionadas con Angulos y la raiz cuadrada”, Annals of Mathematical Statistics , vol. 
21, pp. 607-611) que mejora su desempeno en las colas. La modification de F&T es: 

[arcsen^rc£/(tt+l) + aicscn^(npAl)/(nAi)]/2 

Resolver de nuevo los incisos a al d utilizando esta transformation y comentar los resultados. (Para una 
interesante discusiOn y analisis de este experimento, referirse a “An&lisis de experimentos factoriales con 
defectos o partes defectuosas como respuesta”, de S. Bisgaard y H.T Fuller, Quality Engineering, vol. 7, 
pp. 429-443.) 

8-29. Un experimento factorial fraccionado en nueve factores y 16 corridas fue conducido por el departamento 
Chrysler Motors Engineering y se describe en el artfculo “Mejoramiento del proceso compuesto de moldeo 
de planchas”, de P.L Hsieh y D.E. Goodwin ( Fourth Symposium on Taguchi Methods , American Supplier 
Institute, Dearborn, MI, pp. 13-21). El objetivo era reducir el numero de defectos en el acabado de rejillas de 
planchas moldeadas de recuadros abiertos. El diseho y el numero resultante de defectos, c, observados en 
cada corrida se muestran a continuation. Se trata de una fraction de resolution III con generadores E = BD ; 
F = BCD, G = AC, H - ACD y J = AB. 


Corrida 

A 

B 

C 

D 

E 

F 

G 

H 

/ 

c 


Modificacidn 
de F&T 

1 

- 

- 

- 

- 

A 

- 

A 

- 

+ 

56 

7.48 

7.52 

2 

+ 

- 

- 

- 

A 

- 

- 

A 

- 

17 

4.12 

4.18 

3 

- 

A 

- 

- 

- 

+ 

A 

- 

- 

2 

1.41 

1.57 

4 

+ 

A 

- 

- 

- 

+ 

- 

+ 

+ 

4 

2.00 

2.12 

5 

- 

- 

+ 

- 

+ 

+ 

- 

+ 

+ 

3 

1.73 

1.87 

6 

+ 

- 

+ 

- 

+ 

+ 

+ 

- 

- 

4 

2.00 

2.12 

7 

- 

+ 

+ 

- 

- 

- 

- 

+ 

- 

50 

7.07 

7.12 

8 

+ 

+ 

+ 

- 

- 

- 

+ 

- 

+ 

2 

1.41 

1.57 

9 

- 

- 

- 

+ 

- 

A 

+ 

+ 

+ 

1 

1.00 

1.21 

10 

+ 

- 

- 

+ 

- 

A 

- 

- 

- 

0 

0.00 

0.50 

11 


+ 

- 

A 

+ 

- 

+ 

+ 

- 

3 

1.73 

1.87 

12 

+ 

+ 

- 

+ 

+ 

- 

- 

- 

+ 

12 

3.46 

3.54 

13 

- 

- 

+ 

+ 

- 

- 

- 

- 

+ 

3 

1.73 

1.87 

14 

+ 

- 

+ 

+ 

- 

- 

+ 

+ 

- 

4 

2.00 

2.12 

15 

- 

+ 

+ 

+ 

+ 

+ 

- 

- 

- 

0 

0.00 

0.50 

16 

+ 

+ 

+ 

+ 

+ 

+ 

+ 

+ 

+ 

0 

0.00 

0.50 


a) Encontrar la relation de definiciOn y las relaciones de los alias de este diseho. 

b) Estimar los efectos de los factores y usar una gr&fica de probabilidad normal para hacer la identificaciOn 
tentativa de los factores importantes. 

c) Ajustar uri modelo apropiado utilizando los factores identificados en el inciso b anterior. 

d) Graficar los residuales de este modelo contra el numero predicho de defectos. Asimismo, construir una 
grhfica de probabilidad normal de los residuales. Comentar la adecuaciOn de estas gr&ficas. 
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e) El lector habrd notado en el inciso d un indicio de que la varianza de la respuesta no es constante (consi- 
derando que la respuesta es un conteo, esto deberia haberse anticipado). La tabla anterior tambidn in- 
cluye una transformacidn de c, la raiz cuadrada, que es una transformacidn para estabilizar la varianza de 
uso generalizado con datos de conteos (referirse a la exposicidn de las transformaciones para estabilizar 
la varianza del capftulo 3). Repetir los incisos a al d utilizando la respuesta transformada y comentar los 
resultados. Especificamente, 6han mejorado ahora las grdficas de los residuales? 

f) Hay una modificacidn de la transformacidn de la raiz cuadrada, propuesta por Freeman y Tukey 
(“Tlansformaciones relacionadas con angulos y raiz cuadrada”, A wmz/j of Mathematical Statistics , vol. 
21, pp. 607-611) que mejora su desempeno. La modificacidn de F&T de la transformacidn de la raiz 
cuadrada es: 

[Vc+VF ^ 1 )]/ 2 

Resolver de nuevo los incisos a al d utilizando esta transformacidn y comentar los resultados. (Para una 
interesante discusidn y an&lisis de este experimento, referirse a “An&lisis de experimentos factoriales con 
defectos o partes defectuosas como respuesta”, de S. Bisgaard y H.T Fuller, Quality Engineering, vol. 7, 
pp. 429-443.) 

8-30. Se corre un experimento en una ftibrica de semiconductores para investigar el efecto de seis factores sobre la 
amplificacion del transistor, El diseno seleccionado es el 2 que se muestra a continuacidn: 


Orden 

est£ndar 

Orden de 
las corridas 

A 

B 

C 

D 

E 

F 

Amplificacion 

1 

2 

_ 

_ 

— 

— 


— 

1455 

2 

8 

+ 

- 

- 

- 

+ 

- - 

1511 

3 

5 

- 

+ 

- 

- 

+ 

+ 

1487 

4 

9 

+ 

+ 

- 

- 

- 

+ 

1596 

5 

3 

- 

_ 


- 

+ 

+ 

1430 

6 

14 

+ 

- 

+ 

- 

- 

+ 

1481 

7 

11 


+ 

+ 

- 

- 

- 

1458 

8 

10 

+ 

+ 

+ 

- 

+ 

- 

1549 

9 

15 

- 

- 

- 

+ 

- 

+ 

1454 

10 

13 

+ 

- 

- 

+ 

+ 

+ 

1517 

11 

1 

- 

+ 

- 

+ . 

+ 

- 

1487 

12 

6 

+ 

+ 

_ 

+ 

- 

- 

1596 

13 

12 

- 

- 

+ 

+ 

+ 

- 

1446 

14 

4 

+ 

- 

+ 


- 

- 

1473 

15 

7 

- 

+ 

+ 

+ 

- 

+ 

1461 

16 

16 

+ 

+ 

+ 

+ 

+ 

+ 

1563 


a) Usar una grftfica normal de los efectos para identificar los factores significativos. 

b) Conducir las pruebas estadisticas apropiadas para el modelo identificado en el inciso a . 

c) Analizar los residuales y comentar los resultados. 

d) cEs posible encontrar un conjunto de condiciones de operacidn que produzca una amplificacidn de 1500 
± 25? 

8-31. El tratamiento tdrmico es de uso comun para carbonizar piezas met&licas, como engranes. El espesor de la 
capa carbonizada es una variable de salida critica de este proceso, y suele medirse realizando un an£lisis de 
carbono del paso del engrane (la cara superior del diente del engrane). Se estudiaron seis factores en un dise- 
no 2% 2 :A = temperatura del homo, B = duracidn del ciclo, C = concentracidn de carbono, D = duracidn del 
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ciclo de caibonizaci6n, E — concentration de carbono del ciclo difuso y F = duration del ciclo difuso. El ex- 
perimento se presenta a continuaci6n: 


Orden Orden de 

est&ndar las corridas A B C D E F 


1 

2 

3 

4 

5 

6 
7 


5 

7 

8 
2 

10 

12 

16 


+ - 
— 4 

+ + 


+ - 
- + 


4 

+ 

+ 


- + 

- 4 

- + 


+ 

4 

+ 

+ 


Paso 


74 

190 

133 

127 

115 

101 

54 


8 

1 

4 * + 

4 


4 

- 

144 

9 

6 

— — 

- 

4 

- 

4 

121 

10 

9 

+ - 

- 

4 

4 

4 

188 

11 

14 

- + 

- 

4 

4 

- 

135 

12 

13 

+ 

4 

- 

4 

- 

- 

170 

13 

11 

- 

4 

4 

4 

- 

126 

14 

3 

4 " — 

4 

4 

- 

- 

175 

15 

15 

- + 

4 

4 

- 

4 

126 

16 

4 

4 

4 

4 

4 

4 

4 

193 


a) Estimar los efectos de los factores y representarlos en una grafica de probabilidad normal. Seleccionar 
un modelo tentativo. 

b ) Efectuar las pruebas estadisticas apropiadas en el modelo. 

c) Analizar los residuales y comentar la adecuacidn del modelo. 

d) Interpretar los resultados de este experimento. Suponer que es deseable un espesor de la capa de entre 
140 y 160. 

8-32. Se estudian cinco factores en el diseno factorial fraccionado irregular de resolucidn V mostrado enseguida; 


Orden Orden de 


estdndar 

las corridas 

A 

B 

C 

D 

E 

y 

1 

1 

— 

— 

— 

- 

- 

16.33 

2 

10 

- 

4 

- 

- 

- 

18.43 

3 

5 

4 

' 4 

- 


- 

27.07 

4 

4 

— 

— 

4 

- 

- 

16.95 

5 

15 

4 

-- 

4 

- 

- 

14.58 

6 

19 

— 

4 

4 

- 

- 

19.12 

7 

16 

— 

- 

- 

4 

- 

18.96 

8 

7 

4 

- 

- 

4 

- 

23.56 

9 

8 

4 

4 

- 

4 

- 

29.15 

10 

3 

4 

- 

4 

4 

- 

15.74 

11 

13 

- 

4 

4 

4 

- 

20,73 

12 

11 

4 

4 

4 

4 

- 

21.52 

13 

12 


- 

- 

- 

4 

15.58 

14 

20 

4 

- 

- 

- 

4 

21.03 

15 

9 

4 

4 

- 

- 

4 

26.78 
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Orden 

est£ndar 

Orden de 
las corridas 

A 

B 

C 

D 

E 

y 

16 

22 

+ 

- 

+ 

— 

+ 

13.39 

17 

21 

- 

+ 

+ 

- 

+ 

18.63 

18 

6 

+ 

+ 

+ 

- 

+ 

19,01 

19 

23 

- 

- 

- 

+ 

+ 

17.96 

20 

18 

- 

+ 

- 

+ 

+ 

20.49 

21 

24 

+ 

+ 

- 

+ 

+ 

29.31 

22 

17 

- 

- 

+ 

+ 

+ 

17,62 

23 

2 

+ 

- 

+ 

+ 

+ 

16.03 

24 

14 

- 

+ 

+ 

+ 

+ 

21.42 


a) Analizar los datos de este experimento, 6Qu 6 factores influyen en la respuestay? 

b ) Analizar los residuales. Comentar la adecuacidn del modelo. 




Disenos factoriales y 
factoriales fraccionados 
con tres niveles y con 
niveles mixtos 


Las series con dos niveles de los disenos factoriales y factoriales fraccionados que se comentaron en los 
capitulos 6, 7 y 8 son de uso generalizado en la investigation y el desarrollo industrial. Hay algunas exten- 
siones y variantes de estos disenos que en ocasiones son utiles, como los disenos para los casos en que to- 
dos los factores estdn presentes con tres niveles, Estos disenos 3 k se analizan en este capitulo. Se 
consideran tambien los casos en que algunos de los factores tienen dos niveles y otros factores tienen ya 
sea tres o cuatro niveles. 


9*1 DISENO FACTORIAL 3* 

9*1.1 Notation y motivaci6n del diseno 3* 

Se estudia ahora el diseno factorial 3 k ; es decir, un arreglo factorial de k factores que tienen tres niveles 
cada uno. Se usar&n letras mayusculas para denotar los factores y las interacciones, Se har& referenda a 
los tres niveles de los factores como bajo, intermedio y alto. Hay varias notaciones diferentes que se usan 
para representar estos niveles de los factores; una posibilidad es representar los niveles de los factores 
con los digitos 0 (bajo), 1 (intermedio) y 2 (alto). Cada combination de tratamientos del diseno 3* se de- 
no tara por k digitos, donde el primer digito indica el nivel del factor^, el segundo digito indica el nivel del 
factor B , ..., y el digito fc-6simo indica el nivel del factor K. Por ejemplo, en un diseno 3 2 , 00 denota la com- 
bination de tratamientos correspondiente a A y B ambos en el nivel bajo, y 01 denota la combination de 
tratamientos correspondiente a A en el nivel bajo y B en el nivel intermedio. En las figuras 9-1 y 9-2 se 
muestra la representation geometrica de los disenos 3 2 y 3 3 , respectivamente, utilizando esta notation. 

Este sistema de notation pudo haberse usado en los disenos 2 k presentados anteriormente, utilizando 
0 y 1 en lugar del 1 negativo y el 1 positivo, respectivamente. En el diseno 2 k se prefirid la notacidn ± 1 por- 
que facilita la vista geometrica del diseno y porque puede aplicarse directamente al modelado de regre- 
sidn, la separation en bloques y la construction de factoriales fraccionados. 

En el sistema de los disenos 3 k , cuando los factores son cuantitativos, es comun denotar los niveles 
bajo, intermedio y alto con -1, 0 y + 1, respectivamente. Con esto se facilita el ajuste de un modelo de re- 
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22 


21 


00 10 20 


0 1 2 
Factor A 

Figura 9-1 Combinaciones de tratamientos en un 
diseno 3 2 . 

gresion que relaciona la respuesta con los niveles de los factores. Por ejemplo, considere el diseno 3 2 de la 
figura 9-1, y sea que x x represente al factor^ y que x 2 represente al factor B. Un modelo de regresidn que 
relaciona la respuesta y con x l y x 2 que se basa en este diseno es 

y= 0 O ~*~fil X l + Pl X 2 + fi\2 X l X 2 fin X l ft 22 X 2 (®"^) 

Observe que la adicidn de un tercer nivel de los factores permite que la relaridn entre la respuesta y los 
factores del diseno se modele como un modelo cuadratico. 

El diseno 3 k es ciertamente una eleccidn posible para un experimentador que se preocupa por la cur- 
vatura en la funcidn de respuesta* Sin embargo, es necesario tomar en consideracidn dos puntos: 

1. El diseno 3 k no es la forma m&s eficiente de modelar una relacidn cuadr&tica; los disenos de su- 
perficie de respuesta que se exponen en el capitulo 11 son alternativas superiores. 



Factor A 


Figura 9-2 Combinaciones de tratamientos en un diseno 3 3 , 


02 

12 

01 

11 






9-1 DISENO FACTORIAL 3 l 365 


2. El diseno 2* aumentado con los puntos centrales, como se analizo en el capitulo 6, es una forma 
excelente de obtener una indicacidn de la curvatura. Permite conservar reducido el tamano y la 
complejidad del diseno y al raismo tiempo permite obtener cierta proteccion contra la curvatura. 
Entonces, si la curvatura es importante, el diseno de dos niveles puede aumentarse con corridas 
axiales para obtener un diseno central compuesto, como se ilustra en la figura 6-36. Esta estrate- 
gin secuencial de experimentation es mas eficiente, por mucho, que correr un diseno factorial 3* 
con factores cuantitativos. 

9-1,2 El diseno 3 2 

El diseno mils simple del sistema 3* es el diseno 3 2 , el cual tiene dos factores, cada uno con tres niveles. Las 
combinaciones de tratamientos de este diseno se mostraron en la figura 9-1. Puesto que estan presentes 
3 2 = 9 combinaciones de tratamientos, hay ocho grados de libertad entre estas combinaciones de trata- 
mientos. Los efectos principales d eA y B tienen dos grados de libertad cada uno, y la interacci6nA8 tiene 
cuatro grados de libertad. Si hay n replicas, habra ti3 2 - 1 grados de libertad totales y 3 2 (n - 1) grados de li- 
bertad del error. 

Las sumas de cuadrados de/4, B y AB pueden calculate mediante los mdtodos usuales para los dise- 
nos factoriales analizados en el capitulo 5. Cada efecto principal puede representarse con un componente 
lineal y uno cuadr&tico, cada uno con un solo grado de libertad, como se observa en la ecuacion 9-1. Desde 
luego, esto solo tiene sentido si el factor es cuantitativo. 

La partition de la interaction de dos factores AB puede hacerse de dos maneras. El primer metodo 
consiste en subdividir AB en los cuatro componentes con un solo grado de libertad que corresponden a 
AB l x L ,AB L x q ,AB q * L y AB q x Q . Esto puede hacerse ajustando los tdrminos /5 112 x 2 .x 2 y 
^U 2 i x i X l > respectivamente, como se indicd en el ejemplo 5-5. Para los datos de la vida de la herramienta 
de ese ejemplo se obtiene SS ABl xL = 8.00, SS Ml xQ = 42.67, 55 AB(2 xL = 2.67 y SS^ xQ = 8.00. Puesto que 
se trata de una partition ortogonal dt AB, observe que SS^ = SS^ xL + SS^ xQ + SS^q xL + SS MqxQ 
= 61.34. 

El segundo metodo se basa en los cuadrados latinos ortogonales. Considere los totales de las combi- 
naciones de los tratamientos para los datos del ejemplo 5-5. Estos totales se muestran en la figura 9-3 
como los numeros encerrados en circulos dentro de los cuadrados. Los dos factores/4 y B corresponden a 
los renglones y las columnas, respectivamente, de un cuadrado latino 3 x 3. En la figura 9-3 se muestran 
dos cuadrados latinos 3x3 particulares, superpuestos en los totales de las celdas. 

Estos dos cuadrados latinos son ortogonales; es decir, si uno de los cuadrados se superpone en el otro, 
cada letra del primer cuadrado aparecerA exactamente una vez con cada letra del segundo cuadrado. Los 
totales de las letras en el cuadrado a son Q « 18, R = -2 y S = 8, y la suma de cuadrados entre estos totales 
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Figura 9-3 Tbtales de las combinaciones de los tratamientos del ejemplo 5-5 
con dos cuadrados latinos superpuestos. 
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es [18 2 + (-2) 2 + 8 2 ]/(3)(2) - [24 2 /(9)(2)] = 33.34, con dos grados de libertad. De manera similar, los tota- 
les de las letras en el cuadrado b son g = 0, 7? = 6 y S = 18, y la suma de cuadrados entre estos totales es [0 2 
+ 6 2 + 18 2 ]/(3)(2) - [24 2 /(9)(2)] = 28.00, con dos grados de libertad. Observe que la suma de estos dos 
componentes es 


33.34+28.00= 61.34= 


con 2 + 2 = 4 grados de libertad. 

En general, a la suma de cuadrados calculada con el cuadrado a se le llama el componenteAB de la in- 
teraccion, y a la suma de cuadrados calculada con el cuadrado b se le llama el componenteAB 2 de la inte- 
raction. Cada uno de los componentes AB yAB 2 tiene dos grados de libertad. Se usa esta terminologia 
porque si los niveles (0, 1, 2) deA yB se denotan por*! yx 2 , respectivamente, entonces se encuentra que 
las letras ocupan celdas de acuerdo con el siguiente patrdn: 


Cuadrado a 

Q: x 1 + x 2 = 0 (mod 3) 
R: + x 2 = 1 (mod 3) 
S: x, + x 2 = 2 (mod 3) 


Cuadrado b 

Q: Atj + 2x 2 = 0 (mod 3) 
S: x, + 2x 2 = 1 (mod 3) 
R : x, + 2x 2 = 2 (mod 3) 


Por ejemplo, en el cuadrado b se observa que la celda de en medio corresponde ax x = 1 yx 2 = 1; por lo 
tanto,*! + 2x 2 = 1 + (2)(1) = 3 = 0 (mod 3), y Q ocuparia la celda de en medio. Cuando se consideran ex- 
presiones de la forma A p B q , se establece la convention de que el unico exponente permitido en la primera 
letra es 1. Si el exponente de la primera letra no es 1, la expresion completa se eleva al cuadrado y los ex- 
ponentes se reducen al modulo 3. Por ejemplo, A 2 B es lo mismo que AB 2 porque 

A 2 B = (A 2 B ) 2 = A* B 2 = AB 2 


Los componentes ALB yAB 2 de la interaccidn AB no tienen significado real y por lo general no se in- 
cluyen en la tabla del analisis de varianza. Sin embargo, esta partition en gran medida arbitraria de la 
interaccidnAB en dos componentes ortogonales con dos grados de libertad es muy util para construir di- 
senos mis complicados. Ademas, no hay relacion entre los componentes AB yAB 2 de la interaccion y las 
sumas de cuadrados de AB L x L , AB L x Q , AB S x L y AB g x Q . 

Los componentes AB yAB 2 de la interaccion pueden calcularse de otra manera. Considere los totales 
de las combinaciones de los tratamientos en cualquiera de los cuadrados de la figura 9-3. Si se hace la 
suma de los datos en las diagonales hacia abajo de izquierda a derecha, se obtienen los totales -3 + 4 - 1 = 
0, -3 + 10 - 1 = 6 y 5 + 11 + 2 = 18. La suma de cuadrados entre estos totales es 28.00 (AB 2 ). En forma si- 
milar, los totales de la diagonal hacia abajo de derecha a izquierda son 5 + 4-1 = 8, -3 + 2-1 = -2 y -3 + 
11 + 10 = 18. La suma de cuadrados entre estos totales es 33.34 (AB). Yates llamo a estos componentes 
de la interaccidn los componentes ly J de la interaccion, respectivamente. Se usar.in aqui indistintamente 
las dos notaciones; es decir, 

7(AB)= AB 2 
7(AB)= AB 
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9-1.3 El diseno 3 3 

Suponga ahora que hay tres factores (A,ByC) bajo estudio, y que cada factor tiene tres niveles dispuestos 
en un experimento factorial. Se trata de un diseno factorial 3 3 , y la disposicidn experimental y la notacidn 
de las combinaciones de los tratamientos se presentaron anteriormente en la figura 9-2. Las 27 combina- 
ciones de tratamientos tienen 26 grados de libertad. Cada efecto principal tiene 2 grados de libertad, cada 
interacci6n de dos factores tiene 4 grados de libertad y la interaccion de tres factores tiene 8 grados de li- 
bertad. Si se hacen n rdplicas, hay n3 3 - 1 grados de libertad totales y 3 3 (« - 1) grados de libertad del error. 

Las sumas de cuadrados pueden calcularse utilizando los metodos estandares para los disenos facto- 
riales. Adenitis, si los factores son cuantitativos, es posible hacer la particion de los efectos principales en 
un componente lineal y uno cuadratico, cada uno con un solo grado de libertad. Las interacciones de dos 
factores pueden descomponerse en efectos lineal x lineal, lineal X cuadratico, cuadratico X lineal y cua- 
dratico x cuadratico. Por ultimo, puede hacerse la particion de la interaccion de tres factores ABC en 
ocho componentes con un solo grado de libertad que corresponden a lineal x lineal x lineal, lineal x li- 
neal x cuadratico, etcetera. Esta descomposicidn de la interaccion de tres factores no es por lo general de 
gran utilidad. 

Thmbi6n es posible hacer la particidn de las interacciones de dos factores en sus componentes I yJ. 
fistos se designarian AB, AB 2 , AC, AC 2 , BC y BC 2 , y cada componente tendria dos grados de libertad. 
Como en el diseno 3 2 , estos componentes no tienen signification fisica. 

Es posible hacer la partition de la interaccidn de tres factorcsAilC en cuatro componentes ortogona- 
les con dos grados de libertad, a los que suele denominarse los componentes W, X, Y y Z de la interaccion. 
Ihmbi&i se hace referencia a ellos como los componentes ABtC 1 , AB 2 C, ABC 2 y ABC de la interaccion 
ABC, respectivamente. Las dos notaciones se usan indistintamente; es decir, 

W(ABC)=AB 2 C 2 

X(ABC) = AB 2 C 
Y(ABC) = ABC 2 
Z(ABC) = ABC 

Observe que ninguna de las primeras letras puede tener un exponente diferente de 1. A1 igual que los 
componentes 7 yJ, los componentes W, X, Yy Z no tienen ninguna interpretacion practica. Sin embargo, 
son utiles para construir disenos mas complejos. 

EJEMPLO 9-1 

Se usa una maquina para llenar contenedores metalicos de 5 galones con jarabe para una bebida gaseosa. 
La variable de interns es la cantidad de jarabe perdida debido al espumeo. Se piensa que tres factores in- 
fluyen en el espumeo: el diseno de la boquilla (Al), la velocidad del llenado (B) y la presidn de operacidn 
(C). Se seleccionan tres boquillas, tres velocidades de llenado y tres presiones, y se corren dos replicas de 
un experimento factorial 3 3 . En la tabla 9-1 se muestran los datos codificados. 

El andlisis de varianza de los datos de la p6rdida de jarabe se muestra en la tabla 9-2: Las sumas de 
cuadrados se calcularon con los m6todos usuales. Se observa que la velocidad de llenado y la presion de 
operacidn son estadisticamente significativas. Las tres interacciones de dos factores tambi6n son signifi- 
cativas. En la figura 9-4 se analizan gr^ficamente las interacciones de dos factores. El nivel intermedio de 
la velocidad produce el mejor desempeno, mientras que las boquillas tipo 2 y 3, y la presion baja (10 psi) o 
bien alta (20 psi) parecen ser las mils efectivas para reducir la perdida de jarabe. 
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Tahla 9-1 Datos de la pfrdida de jarabe del ejemplo 94 (las unidades son centimetres cflbicos - 70) 

Tipo de boquilla (^4) 

1 2 3 


Velocidad (en rpm) (B) 


Presi6n (en psi) (C) 

100 

120 

140 

100 

120 

140 

100 

120 

140 

10 

-35 

-45 

-10 

17 

-65 

20 

-39 

-55 

15 


-25 

-60 

15 

24 

-58 

4 

-35 

-61 

-30 

15 

110 

-10 

80 

55 

-55 

110 

90 

-28 

no 

75 

30 

54 

120 

-44 

44 

113 

-26 

135 

20 

4 

-40 

31 

-23 

-64 

-20 

-30 

-61 

54 


5 

-30 

36 

-5 

-62 

-31 

-55 

-52 

4 


El ejemplo 9-1 ilustra una situaci6n en la que el diseno de tres niveles suele encontrar cierta aplica- 
ci6n; uno o m&s de los factores es cualitativo, asumiendo desde luego tres niveles, y los d etnas factores son 
cuantitativos. En este ejemplo, suponga que sdlo hay tres disenos de la boquilla que son de interns. Se tra- 
ta evidentemente, entonces, de un factor cualitativo que requiere tres niveles. La velocidad de llenado y la 
presidn de operaci6n son factores cuantitativos. Por lo tanto, podria ajustarse un modelo cuadratico 
como el de la ecuacion 9-1 en los dos factores, velocidad y presion, con cada nivel del factor boquilla. 

En la tabla 9-3 se muestran estos modelos de regresion cuadraticos. Las/J de estos modelos se estima- 
ron usando un programa de computadora de regresion lineal estandar. (En el capitulo 10 se analizara con 
mayor detalle la regresion de mfnimos cuadrados.) En estos modelos, las variables*! yx 2 estan codificadas 
en los niveles -1, 0, +1, como se estudid anteriormente, y se supusieron los siguientes niveles naturales 
para la presidn y la velocidad: 


Nivel codiflcado 

Velocidad (rpm) 

Presidn (psi) 

-1 

100 

10 

0 

120 

15 

+ 1 

140 

20 


En la tabla 9-3 se presentan estos modelos tanto en tdrminos de estas variables codificadas como en ter- 
minos de los niveles naturales de la velocidad y la presion. 


labia 9-2 Andlisis de varianza de los datos de la pgrdida de jarabe 


Fuente de 
variacidn 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

F o 

Valor P 

A , boquilla 

993.77 

2 

496.89 

1.17 

0.3256 

B, velocidad 

61,190.33 

2 

30,595.17 

71.74 

<0.0001 

C, presidn 

69,105.33 

2 

34,552.67 

81.01 

<0.0001 

AB 

6,300.90 

4 

1,575.22 

3.69 

0.0383 

AC 

7,513.90 

4 

1,878.47 

4.40 

0.0222 

BC 

12,854.34 

4 

3,213.58 

7.53 

0.0025 

ABC 

4,628.76 

8 

578.60 

1.36 

0.2737 

Error 

11,515.50 

27 

426.50 



Tbtal 

174,102.83 

53 
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Figura 9-4 Interacciones de dos factores del ejemplo 94, 


Tabla 9-3 Modelos de regresl6n para el ejemplo 9- 1 


Tipo de boquilla 

x x = velocidad (S), x 2 = Presidn (P) en unidades codificadas 

1 

9 - 22.1 + 3 . 5 *, + 16 . 3* 2 + 51 . 7* 2 - 71 . 8* 2 + 2 . 9*,* 2 

j ) = 1217.3 - 31 . 2565 + 86 . 017 P + 0 . 129175 2 - 2 . 8733 P 2 + 0 . 028755 ? 

2 

j > = 25 . 6 - 22 . 8 *! - 12 . 3* 2 + 14 . 1* 2 - 56 . 9 *| - 0 . 7*,* 2 

S> = 180.1 - 9 . 4755 + 66 . 75 /*+ ( X 0355 2 - 2 . 2767 P 2 - 0 . 00755 /* 

3 

$ = 15.1 + 20 . 3 *, + 5 . 9* 2 + 75 . 8* 2 - 94 . 9* 2 + 10 . 5*,* 2 

9 = 194 ai - 40 . 0585 + 102 . 48 P + ai 8958 S ! - 3 . 7967 P 2 + 0 . 1055 ? 
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En la figura 9-5 se muestran las graficas de contorno de las superficies de respuesta de la p£rdida de 
jarabe constante, como una funcidn de la velocidad y la presion para cada tipo de boquilla. Estas gr&ficas 
revelan information de considerable utilidad acerca del desempeno de este sistema de llenado, Puesto 
que el objetivo es minimizar la perdida de jarabe, se preferiria la boquilla tipo 3, ya que los contornos ob- 
servados mas pequeiios (-60) solo aparecen en esta grafica. Deber&n usarse la velocidad de llenado cerca 
del nivel intermedio de 120 rpm y el nivel de presidn ya sea bajo o alto. 

Cuando se construyen graficas de contorno para un experimento que tiene una mezcla de factores 
cuantitativos y cualitativos, no es raro encontrar que las formas de las superficies de respuesta de los fac- 
tores cuantitativos son muy diferentes en cada nivel de los factores cualitativos. Esto puede observarse en 
cierta medida en la figura 9-5, donde la forma de la superficie para la boquilla tipo 2 es considerablemente 
alargada en comparacidn con las superficies de las boquillas tipo 1 y 3, Cuando esto ocurre, implica que 
las condiciones de operacidn dptimas (y otras conclusiones importantes) en terminos de los factores 
cuantitativos son muy diferentes en cada nivel de los factores cualitativos. 

Es sencillo mostrar la particidn numdrica de la interaccidn ABC en sus cuatro componentes ortogo- 
nales con dos grados de libertad utilizando los datos del ejemplo 9-1. El procedimiento general ha sido 
descrito por Cochran y Cox [26] y Davies [36]. Primero se seleccionan dos cualesquiera de los tres facto- 
res, por ejemplo AB, y se calculan los totales I y J de la interaction AB en cada nivel del tercer factor C. 
Estos c&lculos se presentan a continuation: 


c 

B 


A 


Ibtales 

1 

2 

3 r 

/ 

/ 


100 

-60 

41 

-74 

-198 

-222 

10 

120 

-105 

-123 

-122 

-106 

-79 


140 

-25 

24 

-15 

-155 

-158 


100 

185 

175 

203 

331 

238 

15 

120 

20 

-99 

-54 

255 

440 


140 

134 

154 

245 

377 

285 


100 

9 

-28 

-85 

-59 

-144 

20 

120 

-70 

-126 

-113 

-74 

A0 


140 

67 

-51 

58 

-206 

-155 


Despues, los totales /(AB) y /(AB) se arreglan en una tabla de dos vias con el factor C, y se calculan los to- 
tales de las diagonales / y / de esta nueva disposicidn: 


C 


I(AB) 


Ibtales 

I J 

C 


J(AB) 


Totales 

I J 

10 

-198 

-106 

-155 

-149 

41 

10 

-222 

-79 

-158 

63 

138 

15 

331 

255 

377 

212 

19 

15 

238 

440 

285 

62 

4 

20 

-59 

-74 

-206 

102 

105 

20 

-144 

A0 

-155 

40 

23 


Los totales de las diagonales/y/calculados arriba son en realidad los totales que representan las cantida- 
des /[/(AB) x C] = AB 2 C\J[I(AB ) x C] = AB 2 C,I[J(AB) x C] = ABC 2 yJ[J(AB) x C] = ABC, o los 
componentes W, X, Y y Z de ABC. Las sumas de cuadrados se encuentran de la maner a usual; es decir, 
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Velocidad 
a) Boquilla tipo 1 



6) Boquilla tipo 2 



Velocidad 
c) Boquilla tipo 3 

Figura 9-5 Contomos de la p€rdida de jarabe constante 
(unidades: cc - 70) como una funcidn de la velocidad y la 
presidn para las boquillas tipo 1, 2 y 3, ejemplo 9-1, 
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I[I(AB)xC] = AB 2 C 2 = W(ABC) 

_ (— 149) 2 +(212) 2 +(102) 2 (165) 2 _ 

5 54 =3804.11 

J[I(AB)xC] = AB 2 C = X(ABC) 

= (41) 2 +(19) 2 +(105) 2 (165) 2 

18 54 

I[J{AB)xC] = ABC 2 = Y(ABC) 

(63) 2 +(62) 2 +(40) 2 (165) 2 

‘ is IT - 18 ' 71 

J[J(AB)xC]= ABC = Z(ABC) 

_ (138) 2 +(4) 2 +(23) z (165) 2 

- - - — - 584.11 

Aun cuando se trata de una partition ortogonal de SS ABC , se senala de nuevo que no se acostumbra pre- 
sentarla en la tabla del analisis de varianza. En secciones subsecuentes se analiza la necesidad ocasional 
de calcular uno o mas de estos componentes. 


9' 1 .4 El diseno general 3 k 

Los conceptos utilizados en los disenos 3 2 y 3 3 pueden extenderse de inmediato al caso de k factores, cada 
uno con tres niveles, es decir, a un diseno factorial 3 k . Se emplea la notacibn digital usual para las combi- 
naciones de tratamientos, por lo que 0120 representa una combinacibn de tratamientos en un diseno 3 4 
con A y D en los niveles bajos, B en el nivel intermedio y C en el nivel alto. Hay 3 k combinaciones de trata- 
mientos, con 3*- 1 grados de libertad entre ellas. Estas combinaciones de tratamientos permiten deter- 
minar las sumas de cuadrados de k efectos principals, cada uno con dos grados de libertad; ( k 2 ) 
interacciones de dos factores, cada una con cuatro grados de libertad; y una interaccibn de k factores 
con 2 k grados de libertad. En general, una interaccibn de h factores tiene 2 h grados de libertad. Si se ha- 
cen n rbplicas, hay n3 k - 1 grados de libertad totales y 3 k (n - 1) grados de libertad del error. 

Las sumas de cuadrados de los efectos y las interacciones se calculan con los mbtodos usuales para los 
disenos factoriales. De manera tipica, no se hace ninguna descomposicibn adicional de las interacciones 
de tres factores y de brdenes superiores. Sin embargo, cualquier interaccibn de h factores tiene 2 h ~ l com- 
ponentes ortogonales con dos grados de libertad. Por ejemplo, la interaccibn de cuatro factores ABCD 
tiene 2 4-1 = 8 componentes ortogonales con dos grados de libertad, denotados por ABCD 1 , ABC*D, 
AB 2 CD,ABCD,ABC 1 D 2 ,AB 2 C 2 D,AB 1 CD 2 yAB 2 C 2 D 2 . Al escribirse estos componentes, observe que el 
unico exponente permitido en la primera letra es 1 . Si el exponente de la primera letra no es 1 , entonces la 
expresion completa debe elevarse al cuadrado y los exponentes deben reducirse al mbdulo 3. Para ilustrar 
lo anterior, considere 


A 2 BCD = (A 2 BCD) 2 = A 4 B 2 C 2 D 2 =AB 2 C 2 D 2 

Estos componentes de la interaccibn no tienen ninguna interpretacibn fisica, pero son utiles para cons- 
truir disenos mis complejos. 

El tamano del diseno se incrementa rapidamente con k. Por ejemplo, un diseno 3 3 tiene 27 combina- 
ciones de tratamientos por replica, un diseno 3 4 tiene 81, un diseno 3 5 tiene 243, etcetera. Por lo tanto, con 
frecuencia sblo se considera una sola replica del diseno 3 k , y las interacciones de brdenes superiores se 
combinan para proporcionar una estimacion del error. Como una ilustracibn, si las interacciones de tres 



9-2 confusi6n en el DISENO FACTORIAL 3 k 373 


factores y de ordenes superiores son insignificantes, entonces una sola rdplica del diseno 3 3 proporciona 8 
grados de libertad del error, y una sola r6plica del diseno 3 4 proporciona 48 grados de libertad del error. 
Estos disenos siguen siendo grandes para k > 3 y, por consiguiente, son de escasa utilidad. 


9-2 CONFUSI6N EN EL DISENO FACTORIAL 3 k 

Incluso cuando se considera una sola replica del diseno 3 k , esta requiere tantas corridas que es improba- 
ble que puedan hacerse las 3 k corridas bajo condiciones uniformes. Por lo tanto, con frecuencia es necesa- 
rio hacer la confusidn (o mezclado) en bloques. El diseno 3 k puede confundirse en y bloques 
incompletos, donde p<k. Por lo tanto, estos disenos pueden confundirse en tres bloques, nueve bloques, 
etc6tera. 

9-2 A El diseno factorial 3 k en tres bloques 

Suponga que se quiere confundir el diseno 3* en tres bloques incompletos. Estos tres bloques tienen dos 
grados de libertad entre ellos; por lo tanto, debe haber dos grados de libertad confundidos con los bio- 
ques. Recuerde que en la serie factorial 3* cada efecto principal tiene dos grados de libertad. Ademas, 
cada interaccidn de dos factores tiene cuatro grados de libertad y puede descomponerse en dos compo- 
nentes de la interaccidn (por ejemplo, AB yAB 2 ), cada uno con dos grados de libertad; cada interaccion 
de tres factores tiene ocho grados de libertad y puede descomponerse en cuatro componentes de la in- 
teraccion (por ejemplo,ylBC, ABC 2 ,y4B 2 C yAB 2 C 2 ), cada uno con dos grados de libertad; y asi sucesiva- 
mente. Por lo tanto, es conveniente confundir un eomponente de interaccion con los bloques. 

El procedimiento general consiste en construir una definition de contrastes 

L - a x x x +a 2 x 2 + ■■■ +a k x k (9-2) 

donde a t representa el exponente del factor i-e simo en el efecto que va a confundirse yx t es el nivel del fac- 
tor i-6 simo en una combinaci6n de tratamientos particular. Para la serie 3 k se tiene a t = 0, 1 o 2, donde la 
primera a t diferente de cero es la unidad, y x , — 0 (nivel bajo), 1 (nivel intermedio) o 2 (nivel alto). Las 
combinaciones de tratamientos del diseno 3 k se asignan a los bloques con base en el valor de L (mod 3), 
Puesto que L (mod 3) s61o puede asumir los valores 0, 1 o 2, tres bloques est&n definidos de manera unica. 
Las combinaciones de tratamientos que satisfacenL = 0 (mod 3) constituyen el bloque principal. Este 
bloque incluir& siempre la combinacidn de tratamientos 00 ... 0 . 

Por ejemplo, suponga que quiere construirse un diseno factorial 3 2 en tres bloques. Cualquiera de los 
componentes de la interacci6nv4B,AB o^4B 2 , puede confundirse con los bloques, A1 elegir arbitrariamen- 
te AB 2 , se obtiene la definicion de contrastes 

L= Xj + 2x 2 

El valor de L (mod 3) de cada combinacidn de tratamientos puede encontrarse de la siguiente manera; 

00: L— 1(0)L2(0)= 0=0 (mod 3) 11: L= 1(1)+2(1)= 3 - 0(mod 3) 

01: L= 1(0)+2(1)= 2= 2 (mod 3) 21: L= 1(2)+ 2(1)= 4= 1 (mod 3) 

02: L— 1(0)+ 2(2) = 4=1 (mod 3) 12: L= 1(1) + 2(2)= 5= 2 (mod 3) 

10: L— 1(1) -l- 2(0) = 1 = 1 (mod 3) 22: L= l(2) + 2(2)= 6= 0(mod 3) 

20: L= 1(2)+ 2(0) = 2 = 2 (mod 3) 

En la figura 9-6 se muestran los bloques. 
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Bloque 1 Bloque 2 Bloque 3 


00 


10 


01 

11 


21 


12 

22 


02 


20 


a) Asignaci6n de las combinacionee 
de tratamiento a los bloques 


2 


CQ 



0 


02 

12 

01 

11 

\ — j 


00 10 


22 


21 


20 


• - Bloque 1 
O = Bloque 2 
a = Bloque 3 


J 1 L 

0 1 2 

Factor A 

b) Vista geom6trica 


Figura 9-6 El diseno 3 2 en tres bloques con A# 2 con- 
fuudida. 


Los elementos del bloque principal forman un grupo con respecto a la adicidn mddulo 3. Con refe- 
rencia a la figura 9-6, se observa que 1 1 + 1 1 = 22 y 1 1 + 22 = 00. Las combinaciones de tratamientos de 
los otros dos bloques pueden generarse sumando, en modulo 3, cualquier elemento del nuevo bloque con 
los elementos del bloque principal. Por lo tanto, para el bloque 2 se usa 10 para obtener 

10+00=10 10+11=21 y 10+22=02 

Para generar el bloque 3, al utilizar 01, se encuentra 

01+00=01 01+11 = 12 y 01+22=20 


EJEMPLO 

El an&lisis estadistico del diseno 3 2 confundido en tres bloques se ilustra empleando los datos siguientes, 
los cuales provienen de la r6plica unica del diseno 3 Z que se muestra en la figura 9-6. 

Bloque 1 Bloque 2 Bloque 3 


Ibtales de los bloques =0 7 0 


00= 4 


10=-2 


01= 5 

11 = -4 


21 = 1 


12 = -5 

22= 0 


02= 8 


20= 0 


Al aplicar los m6todos convencionales para el analisis de factoriales, se encuentra que SS A = 131.56 y 
SS B = 0.22. 
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labia 9-4 An&lisis de varianza de los datos del 
e j emplo 9-2 


Fuente de 
variacidn 

Suma de 
cuadrados 

Grados de 
libertad 

Bloques (AB 2 ) 

10.89 

2 

A 

131.56 

2 

B 

0.22 

2 

AB 

2.89 

2 

Tbtal 

145.56 

8 


Se encuentra tambien que 


SS 


Bloques 


(0) 2 +(7) 2 +(Q) 2 (7) 2 _ 10S9 

3 9 


Sin embargo, SS Bloques es exactamente igual al componente AB 2 de la interaccion. Para ver esto, las obser- 
vaciones se escriben de la siguiente manera: 





Factor B 


0 

1 

2 


0 

4 

5 

8 

Factor^ 

1 

”2 

-4 

-5 


2 

0 

1 

0 


Recuerde, por la section 9-1*2, que el componente IoAB 2 de la interacci6nAB puede encontrarse calcu- 
lando la suma de cuadrados entre los totales de la diagonal de izquierda a derecha de la representation 
anterior. Se obtiene asi 


SS 


AB 2 


(0) 2 +(0) 2 +(7) 2 
3 


( 7 ) 

^- = 10.89 
9 


valor que es iddntico a SS BUx>uei . 

El an&lisis de varianza se presenta en la tabla 9-4. Puesto que hay una sola replica, no puede hacerse 
una prueba formal. No es una buena idea utilizar el componente AB de la interaccion como una estima- 
ci6n del error. 


Se considera ahora un diseho un poco mas complicado; un diseno factorial 3 3 confundido en tres blo- 
ques con nueve corridas cada uno. El componente AZ^C 2 de la interaccidn de tres factores se confundira 
con los bloques. La definiciAn de contrastes es 

L= x j +2x 2 +2x 3 

Es sencillo verificar que las combinaciones de tratamiehtos 000, 012 y 101 se encuentran en el bloque 
principal. Las corridas restantes del bloque principal se generan de la siguiente manera: 

(1) 000 (4) 101 + 101 = 202 (7) 101 + 021 = 122 

(2) 012 (5) 012 + 012 = 021 (8) 012 + 202 = 211 

(3) 101 (6) 101 + 012= 110 (9) 021 + 202= 220 
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Para encontrar las corridas de otro bloque se observa que la combinacion de tratamientos 200 no esta en 
el bloque principal. Por lo tanto, los elementos del bloque 2 son 

(1) 200+ 000 = 200 (4) 200 + 202= 102 ( 7) 200+122 = 022 

(2) 200+ 012 = 212 (5) 200 + 021 = 221 (8) 200 + 211 = 111 

(3) 200+101 = 001 (6) 200+110=010 (9) 200+220=120 

Observe que todas estas corridas satisfacen L = 2 (mod 3). El ultimo bloque se encuentra observando que 
100 no pertenece al bloque 1 ni al bloque 2. A1 usar 100 como ariiba, se obtiene 

(1) 100 + 000=100 (4) 100 + 202 = 002 (7) 100+122 = 222 

(2) 100+ 012=112 (5)100+ 021 = 121 (8) 100 + 211 = 011 

(3) 100+101 = 201 (6) 100+110= 210 (9) 100+220= 020 

Los bloques se ilustran en la figura 9-7. 


Bloque 1 

Bloque 2 

Bloque 3 

000 


200 


100 

012 


212 


112 

101 


001 


201 

202 


102 


002 

021 


221 


121 

110 


010 


210 

122 


022 


222 

211 


m 


011 

220 


120 


020 


a) Asignacidn de las combination's de 
tratamientos a ios bloques 



b) Vista geometries 


Figura 9-7 El diseno 3 3 en tres bloques con AB 2 C 2 confundida. 
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labia 9-5 AnSlisis de vananza de un disefio 3 3 
con AB Z C 2 confundida 


Fuente de variacidn 

Grados de 
libertad 

Bloques (AB 2 0) 

2 

A 

2 

B 

2 

C 

2 

AB 

4 

AC 

4 

BC 

4 

Error (ABC + AB 2 C +ABC 2 ) 

6 

Total 

26 


En la tabla 9-5 se presenta el anfilisis de vananza de este disefio. A1 utilizar este esquema de confusiOn 
(o mezclado), se cuenta con information acerca de todos los efectos principales y las interacciones de dos 
factores. Los componentes restantes de la interaccion de tres factores (ABC,AB 2 C y ABC 2 ) se corabinan 
como una estimation del error. La suma de cuadrados de esos tres componentes podria obtenerse por 
sustraccidn. En general, para el disefio 3* en tres bloques se seleccionaria siempre un componente de la 
interaccidn de orden mas alto para confundirlo con los bloques. Los dcmas componentes de esta interac- 
ci6n que no estfin confundidos pueden obtenerse calculando la interaccion de k factores de la manera 
usual y restando de esta cantidad la suma de cuadrados de los bloques. 


9*2.2 El diseno factorial 3* en nueve bloques 

En alg nnas situaciones experimentales puede ser necesario confundir el disefio 3 k en nueve bloques. Por 
lo tanto, ocho grados de libertad se confundiran con los bloques. Para construir estos disefios se eligen dos 
componentes de interaction y, como resultado, dos mas se confundiran automaticamente, produciendo 
los ocho grados de libertad requeridos. Estos dos son las interacciones generalizadas de los dos efectos 
elegidos originalmente. En el sistema 3*, las interacciones generalizadas de dos efectos (es decir, P y Q) se 
definen como PQ y PQ 2 (o P*Q). 

Los dos componentes de interaccion elegidos inicialmente producen das definiciones de contrastes 

I, = a t x x +a 2 x 2 H \-a k x k = u (mod 3) u= 0,1,2 ^9,3^ 

L 2 = p x x 2 +p 2 x 2 + +P k x k = h (mod 3) h= 0, 1, 2 

donde {a,} y {$} son los exponentes de la primera y la segunda interacciones generalizadas, respectiva- 
mente, con la convention de que las primeras a t y ft, diferentes de cero son la unidad. Las definiciones de 
contrastes de la ecuaci6n 9-3 implican nueve ecuaciones simultaneas especificadas por el par de valores 
para L 2 yL 2 . Las combinaciones de tratamientos que tienen el mismo par de valores para (L b L 2 ) se asig- 
nan al m ismo bloque. 

El bloque principal consta de las combinaciones de tratamientos que satisfacen L 1 = L 2 = 0 (mod 3). 
Los elementos de este bloque forman un grupo con respecto a la adicion modulo 3; por lo tanto, el esque- 
ma presentado en la seccion 9-2.1 puede usarse para generar los bloques. 
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Como un ejemplo, considere el diseno factorial 3 4 confundido en nueve bloques con nueve corridas 
cada uno. Suponga que se elige confundir ABC y AB 2 D 2 . Sus interacciones generalizadas 

(ABC)(AB 2 D 2 )= A 2 B 3 CD 2 = (A 2 B 2 CD 2 ) 2 =AC 2 D 
(ABC)(AB 2 D 2 ) 2 =A 2 B S CD 4 = B 2 CD = (B 2 CD) 2 = BC 2 D 2 

tambidn estan confundidas con los bloques. Las definiciones de contrastes de ABC y AB 2 D 2 son 

L 1 =x 1 +x 2 +* 3 ( 9 _ 4 ) 

L 2 ~x 1 + 2x 2 + 2* 4 

Los nueve bloques pueden construirse utilizando las definiciones de contrastes (ecuacion 9-4) y la propie- 
dad de la teoria de grupos del bloque principal. El diseno se muestra en la figura 9-8. 

Para el diseno 3* en nueve bloques habra cuatro componentes de interaction cOnfundidos. Los dem&s 
componentes de estas interacciones que no estan confundidos pueden determinarse restando la suma de 
cuadrados del componente confundido de la suma de cuadrados de la interaccidn completa. El metodo 
descrito en la seccidn 9-1.3 puede ser util para calcular los componentes de interaccidn. 


9'2.3 El diseno factorial 3 k en 3 p bloques 

El diseno factorial 3* puede confundirse en J bloques con 3 k ~ p observaciones cada uno, donde p < k. El 
procedimiento consiste en seleccionar p efectos independientes que habr&n de confundirse con los blo- 
ques. Como resultado, exactamente otros (3? -2 \p - l)/2 efectos se confunden de manera autom&tica. 
Estos efectos son las interacciones generalizadas de los efectos elegidos originalmente. 

Como una ilustracidn, considere un diseno 3 7 que va a confundirse en 27 bloques. Puesto que p = 3, se 
seleccionarian tres componentes de interaccion independientes y se confundirian autom&ticamente otros 
[3 3 - 2(3) - 1]/2 = 10. Suponga que se eligen ABC 2 DG, BCE 2 PG y BDEFG. A partir de estos efectos pue- 


Bloque 1 

• Bloque 2 

Bloque 3 

Bloque 4 

Bloque 5 

Bloque 6 

Bloque 7 

Bloque 8 

Bloque 9 

0000 


0001 


2000 


0200 


0020 


0010 


1000 


0100 


0002 

0122 


0120 


2122 


0022 


0112 


0102 


1122 


0222 


0121 

0211 


0212 


2211 


0111 


0201 


0221 


1211 


0011 


0210 

1021 


1022 


0021 


0221 


1011 


1001 


2021 


1121 


1020 

1110 


1111 


0110 


1010 


1100 


1120 


2110 


1210 


1112 

1202 


1200 


0202 


1102 


1222 


1212 


2202 


1002 


1201 

2012 


2010 


1012 


2212 


2002 


2022 


0012 


2112 


2011 

2101 


2012 


1101 


2001 


2121 


2111 


0101 


2201 


2100 

2220 


2221 


1220 


2120 


2210 


2200 


0220 


2020 


2222 

- (0,0) 

(0,1) 

(2,2) 

(2,0) 

(2,1) 

(1,2) 

(1,1) 

(1,0) 

(0,2) 


Figura 9-8 El diseno 3 4 en nueve bloques con ABC , AB 2 D 2 , AC 2 D y BOD 2 confundidas. 
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den construirse tres definiciones de contrastes, y los 27 bloques pueden generarse con los metodos descri- 
tos anteriormente. Los otros 10 efectos confundidos con los bloques son 

( ABC 2 DG)(BCE 2 F 2 G) = ab 2 de 2 f 2 g 2 
(ABC 2 DG)(BCE 2 F 2 G ) 2 = AB 3 C 4 DE 4 F 4 G 3 = ACDEF 
( ABC 2 DG)(BDEFG)=AB 2 C 2 D 2 EFG 2 
(ABC 2 DG)(BDEFG ) 2 = AB 3 C 2 D 3 E 2 F 2 G 3 = AC 2 E 2 F 2 
(BCE 2 F 2 G)(BDEFG)=B 2 CDE 3 F 3 G 2 = BC 2 D 2 G 
(BCE 2 F 2 G)(BDEFG ) 2 = B 3 CD 2 E 4 F 4 G 3 = CD 2 EF 
(ABC 2 DG)(BCE 2 F 2 G)(BDEFG)~ AB 3 C 3 D 2 E 3 F 3 G 3 = AD 2 
(ABC 2 DG) 2 (BCE 2 F 2 G)(BDEFG) = A 2 B 4 C 5 D 3 G 4 = AB 2 CG 2 
(ABC 2 DG)(BCE 2 F 2 G) 2 ( BDEFG ) = ABCD 2 E 2 F 2 G 
(ABC 2 DG)(BCE 2 F 2 G)(BDEFG ) 2 = ABC 3 D 3 E 4 F 4 G 4 = ABEFG 

Se trata de un diseno enorme que requiere 3 7 = 2187 observaciones dispuestas en 27 bloques con 81 ob- 
servaciones cada uno. 

9-3 REPLICAS FRACCIONADAS DEL DISENO FACTORIAL 3 k 

El concepto de replica fraccionada puede extenderse a los disenos factoriales 3*. Debido a que una riplica 
completa del diseno 3* puede requerir un numero bastante grande de corridas incluso para valores mode- 
rados de k, las rdplicas fraccionadas de estos disenos son de interis. Sin embargo, como se vera mis ade- 
lante, algunos de estos disenos tienen estructuras de alias complicadas. 

9'3.1 La firaccion un tercio del diseno factorial 3 k 

La fraccidn mis grande del diseno 3 k es la fraccion un tercio que contiene 3 k_1 corridas. Por consiguiente, 
se hace referenda a el como el diseno factorial fraccionado 3 k_1 . Para construir un diseno factorial fraccio- 
nado 3*“' se selecdona un componente de interaccion con dos grados de libertad (generalmente, la in- 
teraccion de orden mis alto) y se hace la particidn del diseno 3 k completo en tres bloques. Cada uno de los 
tres bloques resultantes es un diseno fraccionado 3 kA y puede seleccionarse cualquiera de los bloques 
para usarlo. Si AB a 1 C“ 3 • • • K Bt es el componente de interaccion utilizado para definir los bloques, enton- 
ces a / = AB ai C a> ■ ■ ■ K at se le llama la relacidn de definiciin del diseflo factorial fraccionado. Cada efec- 
to principal o componente de interaccidn estimado a partir del diseno 3*" 1 tiene dos alias, los cuales 
pueden encontrarse multiplicando el efecto tanto por I como por I 2 modulo 3. 

Como un ejemplo, considere una fraccidn un tercio del diseno 3 3 . Puede seleccionarse cualquiera de 
los componentes de la interaccidnABC para construir el diseno, es decir, ABC, AB 2 C, ABC 2 o A&C 2 . Por 
lo tanto, hay en realidad 12 fracciones un tercio diferentes del diseno 3 3 definidas por 

x t +a 2 x 2 +03X3 = u (mod 3) 

donde a = lo2y« = 0, lo2. Suponga que se selecciona el componente de^4B 2 C 2 . Cada fraccidn del dise- 
no 3 3-1 resultante contendra exactamente 3 2 = 9 combinaciones de tratamientos que deben satisfacer 


jq +2x 2 +2x 3 = u (mod 3) 
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donde u = 0, 1 o 2. Es sencillo verificar que las tres fracciones un tercio son las que se muestran en la figu- 
ra 9-9. 

Si se corre cualquiera de los disenos 3 3-1 de la figura 9-9, la estructura de los alias resultante es 

A= A(AB 2 C 2 )= A 2 B 2 C 2 = ABC 
A=A(AB 2 C 2 ) 2 =A 3 B 4 C 4 =BC 
B= B(AB 2 C 2 )— AB 3 C 2 — AC 2 
B= B(AB 2 C 2 ) 2 = A 2 B 5 C 4 = ABC 2 
C- C(AB 2 C 2 )= AB 2 C 3 = AB 2 
C= C(AB 2 C 2 ) 2 = A 2 B 4 C 5 = AB 2 C 
AB= AB(AB 2 C 2 )= A 2 B 3 C 2 = AC 
AB= AB(AB 2 C 2 ) 2 = A 3 B S C 4 = BC 2 

Por consiguiente, los cuatro efectos que en realidad se estiman a partir de los ocho grados de libertad 
del diseno son^4 + BC + ABC, B + AC 2 + ABC 2 , C + AB 2 + AB 2 C y AB + AC + BC 2 . Este diseno sdlo 
tendria valor pr£ctico si todas las interacciones fueran pequenas en comparacidn con los efectos principa- 
les. Puesto que los efectos principales son alias de las interacciones de dos factores, se trata de un diseno 
de resolution in. Observe lo complejas que son las relaciones de los alias en este diseno. Cada efecto 
principal es alias de un componente de interaction. Si, por ejemplo, la interaccion de dos factores BC es 
grande, esto distorsionara potencialmente la estimation del efecto principal de A y hard que sea muy 
complicada la interpretation del efecto deAB +AC + BC 2 . Es muy diffcil ver c6mo este diseno podria ser 
de utilidad, a menos que se suponga que todas las interacciones son insignificantes. 


Diserto 1 
u = 0 


Diseflo 1 
1 


Diseflo 1 
u-2 


000 


100 


200 

012 


112 


212 

101 


201 


001 

202 


002 


102 

021 


121 


221 

110 


210 


010 

122 


222 


022 

211 


Oil 


111 

220 


020 


120 


a) Combinacionas de tratamientos 




M — 0 


U= 1 


u * 2 


6) Vista geom6trica 

Figura 9-9 Las tres fracciones un tercio del diseno 3 3 con la relacidn de definicidn I = AB Z C 2 . 
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Antes de dejar el diseno 3^‘ , observe que para el diseno con u - 0 (ver la figura 9-9), si se hace que .4 
denote el renglon y B la columna, entonces el diseno puede escribirse como 

000 012 021 
101 110 122 
202 211 220 

que es un cuadrado latino 3 x 3. El supuesto de las interacciones insignificantes requerido para la inter- 
pretacidn unica del diseno 3^, 1 tiene su paralelo en el diseno del cuadrado latino. Sin embargo, los dos di- 
senos surgen por motivos diferentes, uno como consecuencia de la replica fraccionada y el otro de las 
restricciones sobre la aleatorizacidn. Por la tabla 4-13 se observa que solo hay 3x3 cuadrados latinos y 
que cada uno corresponde a uno de los doce diferentes disehos factoriales fraccionados 3’ 1 . 

Las combinadones de tratamientos en un diseno 3* _1 con la relacidn de definition 
/ = AB “ 2 C"' ■ ■ ■ K“ k pueden construirse utilizando un metodo similar al que se empleo en la serie 2 k ~ p . 
Primero se escriben las 3*" 1 corridas para un diseno factorial de tres niveles complete en k - 1 factores, con 
la notacidn comun 0, 1, 2. Este es el diseno bdsico en la terminologfa del capitulo 8. Despu6s se introduce 
el factor fc-esimo igualando sus x k niveles con el componente apropiado de la interaccidn de orden mas 
alto, por ejemplo AB a2 C a, - (K-l ) at -' , mediante la relacion 

X k = fa X i + Pl X 2 + - + Pk-l X k-X ( 9 ’ 5 ) 

donde /?, = (3-« A )a, (mod 3) para l<i<)t-l.Se obtiene asi un diseno con la resolucidn m&s alta posible. 

Como una ilustracion, se usa este metodo para generar el diseno 3^' con la relacion de definicidn 
I = AB 2 CD que se muestra en la tabla 9-6. Es sencillo verificar que los tres primeros dfgitos de cada com- 
binacidn de tratamientos de esta tabla son las 27 corridas de un diseno 3 3 complete. Se trata del diseno b£- 
sico. ParaAB 2 CDse tiene aj = a 3 = a 4 = lya 2 - 2. Esto implicaque^ = (3-l)a! (mod 3) = (3-l)(l) = 
2,/3 2 = (3 - 1 )a 2 (mod 3) = (3 - 1)(2) = 4 = 1 (mod 3) y& = (3 - 1 )a 3 (mod 3) = (3 - 1)(1) = 2. Por lo tan- 
to, la ecuacidn 9-5 queda como 


x A = 2jc, +jc 2 +2x 3 (9-6) 

Los niveles del cuarto factor satisfacen la ecuacion 9-6. Por ejemplo, se tiene 2(0) + 1(0) + 2(0) = 0, 2(0) 
+ 1(1) + 2(0) = 1, 2(1) + 1(1) + 2(0) = 3 = 0, etcetera. 

El diseno 3^' resultante tiene 26 grados de libertad que pueden usarse para calcular las sumas de 
cuadrados de los 13 efectos principales y los componentes de las interacciones (y sus alias). Los alias 


Tabla 9-6 

Un diseno 3j v 1 
I=AB 2 CD 

con 

0000 

0012 

2221 

0101 

0110 

0021 

1100 

0211 

0122 

1002 

1011 

0220 

0202 

1112 

1020 

1201 

1210 

1121 

2001 

2010 

1222 

2102 

2111 

2022 

2200 

2212 

2120 


382 CAPlTULO 9 DISENOS factoriales y factorial.es fraccionados con tres niveles 


de cualquier efecto se encuentran de la manera usual; por ejemplo, los alias de A son A(AB 2 CD) = 
ABC?D 2 y A(AB 2 CD) 2 = BC 2 D 2 . Puede verificarse que los cuatro efectos principales estan separados de 
cualquier componente de interacciones de dos factores, pero que algunos componentes de interacciones 
de dos factores son alias entre si. Una vez mas se observa la complejidad de la estructura de los alias. Si 
cualquiera de las interacciones de dos factores es grande, probablemente sera muy dificil aislarla con este 
diseno. 

El analisis estadistico de un diseno 3 kA se lleva a cabo con los procedimientos usuales del analisis de 
varianza para experimentos factoriales. Las sumas de cuadrados de los componentes de interacciones 
pueden calcularse como en la section 9-1. Cuando interprete los resultados, recuerde que los componen- 
tes de las interacciones no tienen ninguna interpretation practica. 


9-3.2 Otros disenos factoriales fraccionados 3 t_p 

Para moderar los valores grandes de k, es deseable un fraccionamiento todavia mayor del diseno 3*. En 
general, puede construirse una fraction (jy' del diseno 3 k para p <k, donde la fraction contiene 3 k ~ p corri- 
das. A este diseno se le llama el diseno factorial fraccionado 3*"*\ Por lo tanto, un diseno 3 k ~ 2 es una frac- 
cion un noveno, un diseno 3* -3 es una f raccion un veintisieteavo, etcetera. 

El procedimiento para construir un diseno factorial fraccionado 3 k ~ F consiste en seleccionarp compo- 
nentes de interacciones yusar estos efectos para hacer la partition de las 3 k combinaciones de tratamien- 
tos en y bloques. Entonces cada bloque es un diseno factorial fraccionado 3**. La relation de definition I 
de cualquier fraccidn consta de los p efectos elegidos inicialmente y sus (3^ - 2p - 1)/2 interacciones gene- 
ralizadas. El alias de cualquier efecto principal o componente de interaccidn se obtiene con la multiplica- 
ci6n modulo 3 del efecto por / e l 2 . 

Las corridas que definen un diseno factorial fraccionado 3 fc_p tambien pueden generarse anotando 
primero las combinaciones de tratamientos de un diseno factorial 3^ completo e introduciendo despu6s 
los p factores adidonales igualandolos con los componentes de las interacciones, como se hizo en la sec- 
ci6n 9-3.1. 

El procedimiento se ilustrarf construyendo un diseno 3 4 ~ 2 , es decir, una fraccion un noveno del dise- 
no 3 4 . Sean AB 2 C y BCD los dos componentes de interacciones elegidos para construir el diseno. Sus in- 
teracciones generalizadas son (AB 2 C)(BCD) = AC 2 D y (AB 2 C)(BCD) 2 - ABD 2 . Por lo tanto, la relacion 
de definicidn de este diseno es I = AB 2 C = BCD = AC 2 D = ABD 2 , y el diseno es de resolucion III. Las 
nueve combinaciones de tratamientos del diseno se encuentran apuntando un diseno 3 2 en los factoresA 
y B, y agregando despues dos nuevos factores haciendo 

x 3 = 2x 1 + 
x 4 = 2x 2 +2x 3 


Tabla 9-7 Un diseno 3 4 m 2 
coni = AB Z C 
e l=BCD 


0000 

0111 

0222 

1021 

1102 

1210 

2012 

2120 

2201 
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Tabla 9-8 Estmctura de lo$ alias del disefio 3j,‘ 2 de la tabla 9-7 
Efecto Alias 


I P 


ABC 2 

abcd 

AC D 2 

ab 2 d 

BC 2 

ab 2 c 2 d 2 

CD 2 

BD 2 

AC 

bc 2 d 2 

ABC 2 D 

ab 2 d 2 

ABC 

CD 

AB 2 C 2 D 

AD 2 

AB 2 C 2 

bc 2 d 

AD 

abcd 2 

AB 2 

BD 

ACD 

ABC 2 D : 

ab 2 cd 

BCD 2 

AC 2 D 2 

ab 

AB 2 CD 2 

BC 

AC 2 

ABD 


Esto es equivalente a usar AB 2 C yBCD para hacer la partition del diseno 3 4 completo en nueve bloques y 
luego seleccionar uno de estos bloques como la fracci6n deseada. El disefio completo se muestra en la ta- 
bla 9-7. 

Este diseno tiene ocho grados de libertad que pueden usarse para estimar cuatro efectos principa- 
les y sus alias. Los alias de cualquier efecto pueden encontrarse multiplicando el efecto mddulo 3 por 
AB 2 C, BCD, AC?D, ABD 2 y sus cuadrados. En la tabla 9-8 se presenta la estructura de los alias completa 
del diseno. 

Por la estructura de los alias se observa que este diseno sdlo es util en ausencia de interacciones. Ade- 
nitis, si^4 denota los renglones y B las columnas, entonces al examinar la tabla 9-7 se observa que el diseno 
3 4 „ 2 tambidn es un cuadrado grecolatino. 

El escrito de Connor y Zelen [28] contiene una extensa seleccidn de disenos para 4 < /c < 10. Este escri- 
to se elabord para la National Bureau of Standards y es la tabla mas completa disponible de los planes 3 k ~ p . 

En esta section se ha hecho notar en varias ocasiones la complejidad de las relaciones de los alias de 
los disenos factoriales fraccionados 3*" p . En general, si k es moderadamente grande, por ejemplo k > 4 0 
5, el tamaiio del diseno 3* llevari a muchos experimentadores a considerar fracciones bastante pequehas. 
Desafortunadamente, estos disenos tienen relaciones de alias que incluyen alias parciales de componen- 
tes de interacciones con dos grados de libertad. Esto, a su vez, resulta en un diseno cuya interpretation 
serd dificil, si no imposible, si las interacciones no son insignificantes. Adem&s, no hay esquemas de au- 
mento simples (como el doblez) que puedan usarse para combinar dos 0 m&s fracciones a fin de aislar las 
interacciones significativas. El uso del diseno 3* suele sugerirse cuando hay curvatura presente. Sin em- 
bargo, hay altemativas m£s eficientes (ver el capltulo 11). Por estas razones, se puede concluir que los di- 
senos factoriales fraccionados 3 son soluciones que causan problemas; no son, en general, buenos 
disenos. 

9-4 DISENOS FACTORIALES CON NIVELES MIXTOS 

Se han resaltado los disenos factoriales y factoriales fraccionados en los que todos los factores tienen el 
mismo numero de niveles. El sistema con dos niveles revisado en los capitulos 6, 7 y 8 es de particular utili- 
dad. El sistema de tres niveles presentado en este capitulo es de utilidad mucho menor debido a que los 
disenos son relativamente grandes incluso para un numero modesto de factores, y la mayoria de las frac- 
ciones pequenas tienen relaciones de alias complejas que requeririan supuestos rauy restrictivos respecto 
de las interacciones para ser utiles. 

Estamos convencidos de que los disenos factoriales y factoriales fraccionados de dos niveles deberan 
ser la piedra angular de la experimentacidn industrial para el desarrollo de productos y procesos, detec- 
cidn de defectos y mejoramiento. Sin embargo, existen situaciones en las que es necesario incluir un fac- 
tor (o algunos factores) que tiene m<is de dos niveles. Esto suele ocurrir cuando hay factores tanto 
cuantitativos como cualitativos en el experimento, y el factor cualitativo tiene (por ejemplo) tres niveles. 
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Tabla 9-9 Uso de factores con dos niveles para formar 
un factor con rres niveles 

Factores con dos niveles Factores con tres niveles 


B C X 


*i 

+ — x 2 

— + x 2 

+ + x 3 


Si todos los factores son cuantitativos, entonces deber&n usarse disenos de dos niveles con puntos centra- 
les. En esta seccidn se indica c6mo pueden incorporarse factores con tres y cuatro niveles en un diseno 2 k . 


9-4.1 Factores con dos y tres niveles 

Los disenos en los que algunos factores tienen dos niveles y otros tres niveles pueden derivarse de la tabla 
de signos positivosy negativos del diseno 2 k usual. El procedimiento general se ilustra mejor con un ejem- 
plo. Suponga que se tienen dos variables, donde^4 tiene dos niveles yX tres. Considere la tabla de signos 
positivos y negativos del diseno 2 3 usual con ocho corridas. Los signos de las columnas By C tienen el pa- 
tr6n que se muestra en el lado izquierdo de la tabla 9-9. Sea que los niveles de X est6n representados por 
x v x 2 yx 3 . En el lado derecho de la tabla 9-9 se muestra como se combinan los patrones de los signos de B y 
C para formar los niveles del factor con tres niveles. 

Entonces el factor X tiene dos grados de libertad, y si el factor es cuantitativo, es posible hacer su par- 
ticidn en un componente lineal y uno cuadr&tico, con cada componente teniendo un grado de libertad. En 
la tabla 9-10 se muestra un diseno 2 3 con las columnas rotuladas para indicar los efectos reales que esti- 
man, donde X, yX Q denotan los efectos lineal y cuadratico, respectivamente, de X. Observe que el efecto 
lineal de AT es la suma de las estimaciones de los dos efectos calculadas a partir de las colum n as asociadas 
generalmente con By C, y que el efecto de^4 s61o puede calcularse a partir de las corridas donde X estd en 
el nivel bajo o bien en el alto, es decir, las corridas 1, 2, 7 y 8. De manera similar, el efecto A x X L es la 
suma de los dos efectos que se habrian calculado a partir de las columnas rotuladas generalmente AB y 


Tabla 9-10 

Un factor con dos niveles y un factor con 

tres niveles 

en un disefio 2 3 




Corrida 

A 

X L 

Xl 

A x X L 

A xX L 

Xq 

AxX q 

Combinaciones de 
tratamientos reales 

A 

B 

c 

AB 

AC 

BC 

ABC 

A 


1 

- 

- 

- 

+ 

+ 

+ 

- 

Bajo 

Bajo 

2 

+ 

- 

- 

- 

- 

+ 

+ 

Alto 

Bajo 

3 

- 

+ 

- 

- 

+ 

- 

+ 

Bajo 

Intermedio 

4 

+ 

+ 

- 

4* 

- 

- 

- 

Alto 

Intermedio 

5 

- 

- 

+ 

+ 

- 

- 

+ 

Bajo 

Intermedio 

6 

+ 

- 

+ 

- 

+ 

- 

- 

Alto 

Intermedio 

7 

- 

+ 

+ 

- 

- 

+ 

- 

Bajo 

Alto 

8 

+ 

+ 

+ 

+ 

+ 

+ 

+ 

Alto 

Alto 
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Tabla 9-11 Anllisis de varianza del disefio de la tabla 9-10 


Fuente de 

Suma de 

Grados de Cuadrado 

variacidn 

cuadrados 

libertad 

medio 

A 

SS A 

1 

ms a 

X(X L +X Q ) 

ss x 

2 

ms b 

AX(AxX L +A xX q ) 

SS M 

2 

ms^ 

Error (a partir de las corridas 3 y 5 
y de las corridas 4 y 6) 

SS E 

2 

ms e 

Total 

SS T 

7 



AC . Adem£s, observe que las corridas 3 y 5 son replicas. Por lo tanto, puede hacerse una estimacidn del 
error con un grado de libertad del error utilizando estas dos corridas* De manera similar, las corridas 4 y 6 
son replicas, y esto llevaria a una segunda estimacidn del error con un grado de libertad. La varianza pro- 
medio de estos dos pares de corridas podria usarse como cuadrado medio del error con dos grados de li- 
bertad. En la tabla 9-11 se resume el an&lisis de varianza completo. 

Si se est£ dispuesto a suponer que las interacciones de dos factores y de drdenes superiores son insig- 
nificantes, el diseno de la tabla 9-10 puede convertirse en una fraccidn de resolucidn III con hasta cuatro 
factores con dos nivelesy un solo factor con tres niveles. Esto se conseguiria asociando los factores de dos 
niveles con las columnas^4, AB,AC yABC. La columna.SC no puede usarse para un factor de dos niveles 
porque contiene el efecto cuadr£tico del factor X de tres niveles. 

Puede aplicarse el mismo procedimiento en los disenos 2 k de 16, 32 y 64 corridas. Para 16 corridas es 
posible construir factoriales fraccionados de resolucidn V con dos factores de dos niveles y con dos o tres 
factores de tres niveles. 'Tkmbi^n puede obtenerse una fraccidn con 16 corridas de resolucidn V con 3 fac- 
tores de dos niveles y un factor de tres niveles. Si se incluyen cuatro factores de dos niveles y un solo factor 
de tres niveles en 16 corridas, el diseno ser& de resolucidn III. Los disenos de 32 y 64 corridas permiten 
arreglos similares. Para un estudio adicional de algunos de estos disenos, ver Addleman [lb]. 

9*4-2 Factores con dos y cuatro niveles 

Es muy sencillo incorporar un factor con cuatro niveles en un diseno 2*. El procedimiento para hacerlo 
implica el uso de dos factores con dos niveles para representar el factor con cuatro niveles. Por ejemplo, 
suponga que^4 es un factor de cuatro niveles con los niveles a v a 2 , y <z 4 . Considere dos columnas de la ta- 
bla usual de signos positivos y negativos, por ejemplo las columnas P y Q. El patrdn de los signos de estas 
dos columnas se muestra en el lado izquierdo de la tabla 9-12. El lado derecho de esta tabla muestra c6mo 
estos cuatro patrones de signos corresponderian con los cuatro niveles del factor A Los efectos represen- 


TabLa 9-12 El factor A con cuatro niveles expresado como dos 
factores con dos niveles 

Factores con dos niveles Factores con cuatro niveles 
Corrida P Q A 

1 

2 + — #2 

3 + a 3 

4 + 4- a 4 


T3 

S 

CJ 

(A 

<L> 

t-i 

0 

>■1 

en 

1 

a 

§ 

rt 

3 


3 


05 


+ 1 I + I + + I I + + I + I 1 + 

I I + + + + I I + + I I I I + + 1 

I+I++I+I+I+I 1+1 + 

+ + + +I I I I I I I I+ + + + 

I++I I++I+I 1++! 1 + 

+ +I I++I I 1 I++I I+ + 

+ I+ I+ I+ I I+I+I+I + 

I++I+I I+I++I+I 1 + 

+ +I I I I+ + + +I I I I+ + 

+ I+ ! I+I++I+I 1+1 + 

+ 1 I++I I++I I++! 1 + 

IIIIIIII+ + + + + + + + 

I I I I + + + + I I I I+ + + + 

t-< « in *-* w m . ~ m tn .’qf w m 

**km***h>«;hi*hh*h* 

i i++i i++i I++I i+ + 

1+1+1+1+1+1+1+1 + 
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tados por las columnas Py Q y la interaccidn PQ son mutuamente ortogonales y corresponden al efecto de 
A con tres grados de libertad. 

Para ilustrar esta idea con mayor detalle, suponga que se tiene un factor de cuatro niveles y dos facto- 
res de dos niveles y que es necesario estimar todos los efectos principales y las interacciones en las que in- 
tervienen estos factores. Esto puede hacerse con un diseno de 16 corridas. En la tabla 9-13 se presenta la 
tabla usual de signos positivosy negativos del diseno 2 4 con 16 corridas, donde las columnas A yB se usan 
para formar el factor de cuatro niveles, por ejemplo X, con los niveles*!, x 2 , x 3 yx 4 . Se calcularian las sumas 
de cuadrados de cada columna A,B, ... ,ABCD exactamente igual que en el sistema 2* usual. Despues las 
sumas de cuadrados de todos los factores X, C,D y sus interacciones se forman de la manera siguiente: 


SS X = SS A + SS B 
SS C ® SS C 

ss d = ss d 
SS CD = SS CD 

SS XC ” SS AC + SS BC + ss ABC 
ss xd — ss ad +SS bd 5 ~SS ABD 

SS xcd = SS ACD +SS BCD +SS 

ABCD 


(3 grados de libertad) 
(1 grado de libertad) 
(1 grado de libertad) 
(1 grado de libertad) 
(3 grados de libertad) 
(3 grados de libertad) 
(3 grados de libertad) 


A este diseno podrfa llamarsele 4 x 2 2 . Si uno est& dispuesto a ignorar las interacciones de dos factores, 
pueden asociarse hasta nueve factores adicionales de dos niveles con la columna de la interaccidn de dos 
factores (exceptoAB), la columna de la interaccidn de tres factores y la columna de la interaccidn de cua- 
tro factores. 


9-5 PROBLEMAS 

9-1. Se estudian los efectos de la fuerza del revelador (A) y el tiempo de revelado ( B ) sobre la densidad de la pell- 
cula de placa fotogr&fica. Se usan tres fuerzas y tres tiempos, y se corren cuatro rdplicas de un experimento 
factorial 3 2 , Los datos de este experimento se presentan a continuacidn. Analizar los datos utilizando los m&- 
todos est£ndares para experimentos factoriales. 


Fuerza del revelador 


Tiempo de revelado (minutos) 



10 


14 



18 


1 

0 

2 

1 

3 

2 


5 


5 

4 

4 

2 

4 


6 

2 

4 

6 

6 

8 

9 


10 


7 

5 

7 

7 

8 


5 

3 

7 

10 

10 

10 

12 


10 


8 

7 

8 

7 

9 


8 


9-2. Calcular los componentes I y / de la interaction de dos factores del problema 9-1. 

9-3. Se llevd a cabo un experimento para estudiar el efecto de tres tipos diferentes de botellas de 32 onzas (/l) y 
tres tipos diferentes de aparadores de venta (2?) — anaqueles permanentes lisos, aparadores al final del pasi- 
llo con anaqueles enrejados y refrigeradores para refrescos — sobre el tiempo que toma acomodar diez cajas 
de 12 botellas en los aparadores. Se usaron tres empleados (factor C) en el experimento, y se corrieron dos 
rdplicas de un diseno factorial 3 3 . Los datos del tiempo observado se muestran en la tabla siguiente. Analizar 
los datos y sacar conclusiones. 
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Tipo de 
Empleado botella 


Replica I 



Replica II 


Permanente 

Final del 
pasillo 

Refrigerador 

Permanente 

Final del 
pasillo 

Refrigerador 


Pl&stico 

3.45 

4.14 

5.80 

3.36 

4.19 

5.23 

1 

Vidrio de 28 mm 

4.07 

4.38 

5.48 

3.52 

4.26 

4.85 


Vidrio de 38 mm 

4.20 

4,26 

5.67 

3.68 

4.37 

5.58 


Pl&stico 

4.80 

5.22 

6.21 

4.40 

4.70 

5.88 

2 

Vidrio de 28 mm 

4.52 

5.15 

6.25 

4.44 

4.65 

6,20 


Vidrio de 38 mm 

4.96 

5.17 

6.03 

4,39 

4.75 

6.38 


Plastico 

4,08 

3.94 

5.14 

3,65 

4.08 

4.49 

3 

Vidrio de 28 mm 

4.30 

4,53 

4.99 

4.04 

4.08 

4.59 


Vidrio de 38 mm 

4.17 

4.86 

4.85 

3.88 

4.48 

4.90 


9-4, Un investigador m6dico estudia el efecto de la lidoeafna sobre el nivel de enzimas en el musculo cardiaco de 
perros beagle. En el experimento se usan tres marcas comerciales de lidoeafna (A), tres dosis ( B ) y tres perros 
(C), y se corren dos rdplicas de un diseno factorial 3 3 . Los niveles de enzimas observados se presentan a conti- 
nuacion. Analizar los datos de este experimento. 


Marca de 
lidoeafna 

Fuerza de 
la dosis 


Replica I 



Replica II 



Perro 



Perro 


1 

2 

3 

1 

2 

3 


1 

96 

84 

85 

84 

85 

86 

1 

2 

94 

99 

98 

95 

97 

90 


3 

101 

106 

98 

105 

104 

103 


1 

85 

84 

86 

80 

82 

84 

2 

2 

95 

98 

97 

93 

99 

95 


3 

108 

114 

109 

110 

102 

100 


1 

84 

83 

81 

83 

80 

79 

3 

2 

95 

97 

93 

92 

96 

93 


3 

105 

100 

106 

102 

111 

108 


9-5. Calcular los componentes I y / de las interacciones de dos factores del ejemplo 10-1. 

9-6. Se realiza un experimento en un proceso qufmico utilizando un diseno factorial 3 2 . Los factores del diseno 
son la temperatura y la presidn, y la variable de respuesta es el rendimiento. Los datos que resultan de este 
experimento se presentan a continuation: 


Temperatura, °C 

100 

Presi6n, psig 

120 

140 

80 

47.58, 48,77 

64.97, 69.22 

80.92, 72.60 

90 

51.86, 82.43 

88.47, 84.23 

93.95, 88.54 

100 

71.18, 92.77 

96.57, 88,72 

76.58, 83.04 


a) Analizar los datos de este experimento conduciendo un an&lisis de varianza. 6Qu£ conclusiones pueden 
sacarse? 

b) . Analizar graficamente los residuales. 6Hay algun motivo de preocupaciOn respecto de los supuestos sub- 

yacentes o de la adecuacidn del modelo? 
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c) Verificar que si se hace que los niveles bajo, intermedio y alto de ambos factores de este diseno asuman 
los niveles -1, 0 y + 1, entonces un ajuste de mmimos cuadrados de un modelo de segundo orden del ren- 
dimiento es 

y= 86.81 + 10 . 4 ^ + 8 . 42 ^ - 7 . 17* 2 - IMx] - 7 . 69 x , jc 2 

d) Confirmar que el modelo del inciso c puede escribirse en tdrminos de las variables naturales — la tempe- 
ratura ( T) y la presibn (P) — como 

y= - 1335.63+ 18.56T+8.59P- 0.072J 2 - 0.0196F 2 - 0.03847P 

e) Construir una gr£fica de contorno del rendimiento como una funcibn de la presibn y la temperatura. 
Con base en el examen de esta gr&fica, 6dbnde se recomendaria operar este proceso? 

9-7. a) Confundir un diseno 3 3 en tres bloques utilizando el component e ABC 2 de la interaction de tres factores. 
Comparar los resultados obtenidos con el diseno de la figura 9-7. 

b) Confundir un diseno V en tres bloques utilizando el component e AB 2 C de la interaction de tres factores. 
Comparar los resultados con el diseno de la figura 9-7. 

c) Confundir un diseno 3 3 en tres bloques utilizando el componente ABC de la interaccibn de tres factores. 
Comparar los resultados obtenidos con el diseno de la figura 9-7. 

d) Despubs de observar los disenos de los incisos a, b y c y la figura 9-7, Lqu 6 conclusiones pueden sacarse? 
9-8. Confundir un diseno 3 4 en tres bloques utilizando el component cAB 2 CD de la interaccion de cuatro factores. 
9-9. Considere los datos de la primera rbplica del problema 9-3. Suponiendo que no fue posible hacer las 27 ob- 

servaciones el mismo dia, establecer un diseno para conducir el experimento en tres dias con AB 2 C confundi- 
da con los bloques. Analizar los datos. 

9-10. Delinear la tabla del andlisis de varianza del diseno 3 4 en nueve bloques. £Se trata de un diseno pr£ctico? 

9-11. Considere los datos del problema 9-3. Si ABC estd confundida en la rbplica I yABC 2 est£ confundida en la r6- 
plica II, realizar el an^lisis de varianza. 

9-12. Considere los datos de la rbplica I del problema 9-3. Suponga que sblo se corre una fraccibn un tercio de este 
diseno con I = ABC. Construir el diseno, determinar la estructura de los alias y analizar los datos. 
9-13. Por el examen de la figura 9-9, £qu6 tipo de diseno quedaria si despubs de completar las nueve primeras co- 
rridas pudiera eliminarse uno de los tres factores? 

9-14. Construir un diseno 3?^ con I = ABCD. Escribir la estructura de los alias de este diseno. 

9-15. Verificar que el diseno del problema 9-14 es un diseno de resolucibn IV. 

9-16. Construir un diseno 3 5 - 2 con/ = ABC e / = CDE. Escribir la estructura de los alias de este diseno. 4Cu&l es la 
resolucibn de este diseno? 

9-17. Construir un diseno 3 9-6 y verificar que es un diseno de resolucibn III. 

9-18, Construir un diseno 4 x 2 3 confundido en dos bloques con 16 observaciones cada uno. Delinear el analisis de 
varianza de este diseno. 

9-19, Delinear la tabla del analisis de varianza de un diseno factorial 2 2 3 2 . Comentar la manera en que este diseno 
puede confundirse en bloques. 

9-20. Empezando con un diseno 2 4 de 16 corridas, indicar cbmo pueden incorporarse dos factores de tres niveles 
en este experimento, cCudntos factores de dos niveles pueden incluirse si se quiere cierta informacibn sobre 
las interacciones de dos factores? 

9-21. Empezando con un diseno 2 4 de 16 corridas, indicar cbmo pueden incorporarse un factor con tres niveles y 
tres factores con dos niveles, de tal modo que siga siendo posible la estimacibn de las interacciones de dos 
factores. 

9-22. En el problema 8-26 el lector conocib a Harry y Judy Peterson-Nedry, dos amigos del autor que son propieta- 
rios de un vinedo y una fabrica vinicola en Newberg, Oregon. En ese problema se describib la aplicacibn de 
disenos factoriales fraccionados de dos niveles en su producto Pinot Noir 1985. En 1987 quisieron conducir 
otro experimento Pinot Noir. Las variables de este experimento fueron 
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Variable 

Cion de Pinot Noir 
Thmano de la uva 
Temperatura de fermentacidn 
Uva completa 
Tiempo de maceracidn 
Tipo de levadura 
Tipo de roble 


Niveles 

Wadenswil, Pommard 
Pequeno, grande 
80°F ? 85°F, 90/80T, 90°F 
Ninguno, 10% 

10 dias, 21 dfas 
Assmanhau, Champagne 
Ttongais, Allier 


Harry y Judy decidieron usar un diseno factorial fraccionado de dos niveles con 16 corridas, tratando los cua- 
tro niveles de la temperatura de fermentacidn como dos variables de dos niveles. Como en el problema 8-26, 
utilizaron las calificaciones de un panel de catadores como variable de respuesta. El disefio y las calificacio- 
nes promedio resultantes se presentan enseguida: 




Ihmano 

Ibmperatura de 

Uva 

Tiempo de 

Tipo de 

Tipo de 

Calificacidn 

Corrida Cion 

de la uva 

fermentacidn 

completa 

maceracidn 

levadura 

roble 

promedio 

1 

2 

+ 

- 

- 

- 

+ 

+ 

+ 

4 

10 

3 

- 

+ 

- 

+ 

- 

+ 

+ 

6 

4 

+ 

+ 

- 

+ 

+ 

- 

- 

9 

5 

- 

- 

+ 

•f 

+ 

+ 

- 

11 

6 

+ 

- 

+ 

+ 

- 

- 

+ 

1 

7 

- 

+ 

+ 

- 

+ 

- 

+ 

15 

8 

+ 

+ 

+ 

- 

- 

+ 

_ 

5 

9 

- 

- 

+ 


+ 

- 

+ 

12 

10 

+ 

- 

+ 

+ 

- 

+ 

_ 

2 

11 

- 

+ 

+ 

- 

+ 

+ 

- 

16 

12 

+ 

+ 

+ 

- 

- 

- 

+ 

3 

13 

- 

- 


+ 

- 

- 

+ 

+ 

8 

14 

+ 

- 

+ 


- 

+ 

- 

- 

14 

15 

- 

+ 

+ 

+ 

+ 

- 

- 

- 

7 

16 

+ 


+ 

-1- 

+ 

+ 

+ 

+ 

13 


a) Describir los alias de este diseno. 

b ) Analizar los datos y sacar conclusiones. 

c) LQu 6 comparaciones pueden hacerse entre este experimento y el experimento del Pinot Noir 1985 del 
problema 8-26? 

9-23. En un articulo de W.D. Baten publicado en el volumen de 1956 de Industrial Quality Control se describe un 
experimento para estudiar el efecto de tres factores sobre la longitud de unas barras de acero. Cada barra se 
sometid a uno de dos procesos de tratamiento tdrmico y se cortd en una de cuatro mdquinas en una de tres 
horas durante el dfa (8 a.m., 11 a.m, o 3 p.m,). Los datos de la longitud codificada son los siguientes: 


Hora del 

Proceso de 



M&quina 


dfa 

tratamiento tdrmico 


1 

2 

3 

4 


1 

6 

9 

7 9 

1 2 

6 6 


1 

3 

5 5 

0 4 

7 3 


8 a.m. 


2 


4 

0 


6 6 5 -1 0 4 

1 3 4 0 1 5 


5 

4 
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Hora del 

Proceso de 




Mdquina 




dia 

tratamiento t6rmico 

1 


2 


3 

4 




6 

3 

8 

7 

3 

2 

7 

9 


l 

1 

-1 

4 

8 

1 

0 

u 

6 

11 a.m. 

2 

3 

1 

6 

4 

2 

0 

9 

4 


1 

-2 

1 

3 

-1 

1 

6 

3 



5 

4 

10 

11 

-1 

2 


5 


l 

9 

6 

6 

4 

6 

1 

4 

8 

3 p.m. 

2 

6 

3 

0 

7 

8 

10 

7 

0 

0 

4 

-2 

-4 

4 

7 



a) Analizar los datos de este experimento suponiendo que las cuatro observaciones de cada celda son repli- 
cas. 

b) Analizar los residuales de este experimento. iExiste algun indicio de que hay un punto atipico en una de 
las celdas? Si se encuentra un punto atipico, eliminarlo y repetir el an&lisis del inciso a. LA qu£ conclusio- 
ns se llega? 

c) Suponga que las observaciones de las celdas son las longitudes (codificadas) de barras que se procesaron 
conjuntamente en el tratamiento t6rmico y despu6s se cortaron secuencialmente (es decir, en orden) en 
las cuatro m£quinas. Analizar los datos y determinar los efectos de los tres factores sobre la longitud pro- 
medio. 

d) Calcular la varianza logaritmica de las observaciones de cada celda. Analizar esta respuesta. 6 Que con- 
clusiones pueden sacarse? 

e) Suponga que la hora en que se corta una barra en realidad no puede controlarse durante la produccidn 
rutinaria. Analizar la longitud promedio y la varianza logaritmica de la longitud de cada una de las 12 ba- 
rras cortadas en cada combination m&quina/proceso de tratamiento t6rmico, lQ\x6 conclusiones pueden 
sacarse? 





Ajuste de 
modelos de 
regresion 


10-1 INTRODUCTION 

En muchos problemas hay dos o mds variables relacionadas, y el interns se centra en modelar y explorar 
esta relation. Por ejemplo, en un proceso qufrnico el rendimiento del producto est& relacionado con la 
temperatura de operation. Quiza el ingeniero quimico quiera construir un modelo que relacione el rendi- 
miento con la temperatura para usarlo despuds como herramienta de prediccidn o bien de optimization o 
control del proceso. 

En general, suponga que hay una sola variable dependiente o de respues tay que depende de k varia- 
bles independientes o regresores, por ejemplo, x 1? x 2 , La relacidn que existe entre estas variables se 

caracteriza por un modelo matematico llamado modelo de regresidn. Dicho modelo se ajusta a un con- 
junto de datos muestrales. En ocasiones el experimentador conoce la forma exacta de la verdadera rela- 
tion funcional entrey ..>,x k , por ej employ = (p(x u x 2> :-,x k ). Sin embargo, en lamayoria de los casos 

no se conoce la verdadera relation funcional, y el experimentador elige una funcidn apropiada para apro- 
ximar <p. Los modelos polinomiales de orden inferior son de uso generalizado como funciones de aproxi- 
macidn, 

Existe una fuerte relation retiproca entre el diseho de experimentos y el analisis de regresion. A lo 
largo de este libro se ha destacado la importancia de expresar cuantitativamente los resultados de un ex- 
perimento, en terminos del modelo empfrico, a fin de facilitar su comprensidn, interpretatidn e imple- 
mentation. Los modelos de regresion constituyen la base para conseguirlo. Se ha presentado en multiples 
ocasiones el modelo de regresion que representaba los resultados de un experimento. En este capftulo se 
presentan algunos aspectos del ajuste de estos modelos. Presentaciones mas completas de la regresion se 
encuentran en Montgomery y Peck [82] y Myers [84]. 

Los metodos de regresion se utilizan con frecuencia para analizar datos de experimentos no planea- 
dos, como podria ser el caso de la observacidn de fendmenos no controlados o de registros histdricos. Los 
metodos de regresion tambien son muy utiles en experimentos disehados cuando algo “salio mal”. En 
este capitulo se ilustran algunas de estas situaciones. 


392 
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10'2 MODELOS DE REGRESIDN LINEAL 

La atencion se central en el ajuste de modelos de regresidn lineal. Para ilustrar, suponga que quiere de- 
sarrollarse un modelo empirico que reladone la viscosidad de un polimero con la temperatura y la veloci- 
dad de alimentacidn del catalizador. Un modelo que podria describir esta relacidn es 

y= Po+Pl X l+P2 X 2+ £ C 10-1 ) 

dondey representa la viscosidad, x x la temperatura y x 2 la velocidad de alimentacidn del catalizador. Se 
trata de un modelo de regresidn lineal multiple con dos variables independientes. Es comun llamar a las 
variables independientes variables predictoras o regresores (variables de regresidn). Se utiliza el tdrmi- 
no lineal porque la ecuacion 10-1 es una funcidn lineal de los par&metros desconocidos $ 0 , fiy y fi 2 - El mo- 
delo describe un piano en el espacio bidimensionalxu^. El parametro/J 0 define la intersection del piano 
con el eje de las ordenadas. En ocasiones fi x y fi 2 se denominan los coeficientes de regresidn partial, porque 
fi x mide el cambio esperado en y para cada cambio unitario de x x cuando x 2 se mantiene constante, y fi 2 
mide el cambio esperado en y para cada cambio unitario de x 2 cuando x x se mantiene constante. 

En general, la variable de respuesta y puede relacionarse con k regresores. A1 modelo 

y=P 0 + Pl X l+p2 X 2 + -+Pk X k +e ( 10 ’ 2 ) 

se le llama modelo de regresidn lineal multiple con k regresores. A los parametros# J = 0, 1, k se les lla- 
ma los coeficientes de regresidn . Este modelo describe un hiperplano en el espacio de k dimensiones de los 
regresores {x ; }. El par&metro fij representa el cambio esperado en la respuesta y para un cambio unitario 
en Xj cuando las variables independientes restantes x ; ( i * j) se mantienen constantes. 

Con frecuencia los modelos cuya apariencia es mas compleja que la ecuacion 10-2 pueden tambidn 
analizarse mediante tdcnicas de regresidn lineal multiple, Por ejemplo, considere la incorporation de un 
tdrmino de interaction en el modelo de primer orden en dos variables, por ejemplo 

y= Po+PiXi+PiX 2 + Pn x i x 2 + £ ( 10 ' 3 ) 

Si se hace x 3 - xp: 2 y /J 3 = fi l2 , entonces la ecuacidn 10-3 puede escribirse como 

y= fi 0 + fi X X X + fi 2 X 2 + ^ 3*3 + £ ( 10 ' 4 ) 

que es un modelo de regresidn lineal multiple est&ndar con tres regresores. Recuerde que en algunos 
ejemplos de los capitulos 6, 7 y 8 se presentaron varios modelos empiricos similares a las ecuaciones 10-2 y 
10-4 para expresar cuantitativamente los resultados de un diseno factorial de dos niveles. Como otro 
ejemplo, considere el modelo de superilcie de respuesta de segundo orden en dos variables: 

y= Po + fii x i + @2 X 2 + fin x i + Pn x l + Pn x i x 2 +£ ( 10 ~ 5 ) 

Si se hacex 3 = x* ,x 4 = x\ ,x 5 = xpr 2 , fi 3 = finifi* = fin Yfis = fin, entonces esta expresidn queda como 

y= fio +fii x i +fiz x i +fis x i fi 4 X 4 + fis x 5 + £ ( 10 - 6 ) 

que es un modelo de regresidn lineal. Este modelo se ha visto tambien en ejemplos anteriores de este H- 
bro. En general, cualquier modelo de regresidn que es lineal en los parametros (los valores/?) es un mode- 
lo de regresidn lineal, independientemente de la forma de la superficie de respuesta que genera. 

En este capitulo se resumir&n los mdtodos para estimar los parametros de los modelos de regresidn li- 
neal multiple, A este procedimiento suele llamarsele el ajuste del modelo. Se analizaran tambien los md- 
todos para probar hipdtesis y para construir intervalos de confianza para estos modelos, asi como para 
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verificar la adecuacion del ajuste del modelo. La atencion se centra en los aspectos del analisis de regre- 
si6n que son utiles en los experimentos disenados. Para presentaciones mas completas de la regresion, re- 
ferirse a Montgomery y Peck [82] y Myers [84]. 

10-3 ESTIMACION DE LOS PARAMETROS EN MODELOS 
DE REGRESION LINEAL 


El metodo de mmimos cuadrados se usa de manera tipica para estimar los coeficientes de regresidn de un 
modelo de regresidn lineal multiple. Suponga que se cuenta con n > k observaciones de la variable de res- 
puesta, por ejemplo,}^,}^, Junto con cada respuesta observaday, se tendxa una observation de cada 
uno de los regresores, y sea quex tj denote la observation o nivel i-6 simo de la variable Los datos apare- 
ceran como en la tabla 10-1. Se supone que el t^rmino del error e del modelo tiene E(e) -0y V(e) = o 2 y 
que las {£*} son variables aleatorias no correlacionadas. 

La ecuacidn del modelo (ecuacion 10-2) puede escribirse en t^rminos de las observaciones de la tabla 
10-1 como 


.Vi ft Q +ft\ x i\ + ftz X i2 *** ~*~ftk x ik ~*~ € i 

k 

= + 2 Pj X t +£ ‘ * = 1,2,— ,77 

7=1 


(10-7) 


El metodo de mmimos cuadrados consiste en elegir las /? de la ecuacion 10-7 de tal modo que la suma de 
cuadrados de los errores, se minimice. La funcidn de mfnimos cuadrados es 



e~ 



( 10 - 8 ) 


La funcion L debe minimizarse con respecto a p [h p { , ..., i’> k . Los estimadores de mmimos cuadrados, por 
ejemplo fi 0 , p k , deben satisfacer 


dL 


Po,h 




(10-9a) 


y 


dL 


n k 

= yi-K-'Z Pj*t x iJ = 0 7 = 1.2,..., k 


(10-9b) 


0o>0i h 


M- 


Tabla 1(M Datos de una regresidn lineal multiple 


y 

Xi 

x i 

x k 

yi 

*a 

X \2 

x lk 

y 2 

X 2\ 

X 22 

X 2k 

y n 

X nl 

X»2 

X nk 
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A1 simplificar la ecuaci6n 10*9, se obtiene 


n 

*0o+0i2 *,l 

i=l 

+02 2 *12 +• 
/-I 

+0*2 ** 

i-l 

II 


00 2 *«+0t2 

1=1 i-l 

n 

+02 2 *n*n + - 
1=1 

rt 

i=i 

■ 2 w 

i-i 

(10-10) 

n n 

A, 2 X ik X il 

i - 1 i=l 

n 

+02 2 x ik x n + - 

J=1 

■•+0,2 ** 
i-l 

= 2 *** 
i—1 



Estas ecuaciones se denominan ecuaciones normales de nunimos cuadrados. Observe que hay p = k + 1 
ecuaciones normales, una para cada uno de los coeficientes de regresion desconocidos. La solucidn de las 
ecuaciones normales seran los estimadores de minimos cuadrados de los coeficientes de regresion 

K h-, k- 

Es mSs sencillo resolver las ecuaciones normales si se expresan en la notation matricial, A continua- 
tion se presenta el desarrollo matricial de las ecuaciones normales que es antilogo al desarrollo de la 
ecuacion 10-10. El modelo en t6rminos de las observaciones, ecuacidn 10-7, puede escribirse en notation 
matricial como 

y = X/i + e 

donde 



En general, y es un vector (n x 1) de las observaciones, X es una matriz (n x p) de los niveles de las varia- 
bles independientes,/? es un vector (p x 1) de los coeficientes de regresion, y s es un vector (« x 1) de los 
errores aleatorios. 

Quiere encontrarse el vector de los estimadores de minimos cuadrados, 0, que minimice 

n 

^-2 e, 2 =«'e = (y-X0)'(y-X0) 

/=! 


Observe que L puede expresarse como 


L=y’y-p'X'y-y’X0+p'X'Xfi 
= y'y-2fi'X'y+0'X 'Xfi 


( 10 - 11 ) 


ya que/J'X'y es una matriz (lx 1), o un escalar, y su transpuesta (0'X'y ) ' = y'Xfi es el mismo escalar. Los 
estimadores de minimos cuadrados deben satisfacer 
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dL 


= -2X'y + 2X'X0=O 


cuya simplificaci6n es 

X'Xfi = X'y (10-12) 

La ecuacion 10-12 es la forma matricial de las ecuaciones normales de mlnimos cuadrados. Es identica a 
la ecuacibn 10-10. Para resolver las ecuaciones normales, ambos miembros de la ecuacibn 10-12 se multi- 
plican por la inversa de X'X. Por lo tanto, el estimador de mlnimos cuadrados de /? es 

p=(X'XT l X'y (10-13) 

Es sencillo ver que la forma matricial de las ecuaciones normales es identica a la forma escalar . A1 de- 
sarrollar en detalle la ecuacibn 10-12, se obtiene 


n 

n 

2 

x a 

n 

2 

*,2 

rt 

2 

** 

'K 


n 

2 

P,- 


i* 1 


i=l 


i^l 




i=l 



n 

2 

X 2 
x il 

2 

*0*12 • 

2 

X iL X * 

k 


2 

*,iPi 

1=1 . 

1=1 

; 

i-l 

; 

l=l 

: 

: 


1=1 

l 

n 

n 


n 


n 




n 



2 

*»*a 

2 

x tk x n ‘ 

■■ 2 

jc 2 

A . 


2 


.1*1 

1=1 


i-l 


1=1 

. 


Li-1 

- 


Si se efectua la multiplicacibn matricial indicada, se obtendri la forma escalar de las ecuaciones normales 
(es decir, la ecuacibn 10-10). En esta forma es sencillo ver que X'X es una matriz simetrica (p x p) y que 
X'y es un vector columna (p x 1). Observe la estructura especial de la matriz X'X. Los elementos de la 
diagonal de X'X son las sumas de cuadrados de los elementos de las columnas de X, y los elementos que 
no estan en la diagonal son las sumas de los productos cruzados de los elementos de las columnas de X. 
Ademds, observe que los elementos de X'y son las sumas de los productos cruzados de las columnas de Xy 
las observaciones {y,}. 

El modelo de regresion ajustado es 

y= 3$ (10-14) 

En notaci6n escalar, el modelo ajustado es 

k 

i = 1 

La diferencia entre la obseivacibn real y, y el valor ajustado correspondiente y, es el residual, es decir, 
e = y t - % . El vector (n x 1) de los residuales se denota por 

e = y - y (10-15) 


Estimacibn de <r z 

Por lo general tambibn es necesario estimar a 2 . Para desarrollar un estimador de este parametro, conside- 
re la suma de cuadrados de los residuales, por ejemplo 


ss E = 'Z a -?,) 2 



= e e 
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A1 sustituir e = y- y = y- Xfi, se tiene 

SS E =( y-X&)(y-Xfi) 

= y'y- fi'X'y-y'Xfi+fi'X'Xfi 
= y'y-2fi’x'y+fi'x'xfi 

Puesto que X'Xfi = X'y, esta ultima ecuacidn queda como 

SS £ = yy-fiXy (10-16) 


A la ecuacidn 10-16 se le llama la suma de cuadrados residual o del error, y tiene n-p grados de libertad 
asociados con ella. Puede demostrarse que 

E(SS £ ) = o\n-p) 


por lo que un estimador insesgado de o 2 esta dado por 




n-p 


(10-17) 


Propiedades de los esdmadores 

El metodo de mfnimos cuadrados produce un estimador insesgado del parametro fi del modelo de regre- 
sion lineal. Esto puede demostrarse f&cilmente tomando el valor esperado de fi de la siguiente manera: 

E(fi) = E\(X'Xr l X'y] 

= E[(X'Xy\Xfi+ e )] 

= ^(X'X^X'J^-KX'XJ-'X'e] 

= 0 

ya que E(e) = 0 y (X'X^X'X = I. Por lo tanto, fi es un estimador insesgado de fi. 

La propiedad de la varianza de fi se expresa en la matriz de covarianza: 

Cov(fi) = E{[fi- E(0)][0- E(0)]'} (10-18) 

que es una matriz simetrica cuyo elemento i-esimo de la diagonal principal es la varianza del coeficiente 
de regresion individual fi., y cuyo elemento (y)-6simo es la covarianza entre fi. y fi . . La matriz de cova- 
rianza de fi es 

Co w(fi) = a 2 (X'Xy l (10-19) 


5JEMPLO 10*1 ■■ 

En la tabla 10-2 se muestran 16 observaciones de la viscosidad de un polimero (y) y dos variables del pro- 
ceso: la temperatura de reaccidn (jc,) y la velocidad de alimentacion del catalizador (x 2 ). Se ajustara el mo- 
delo de regresidn lineal multiple 


y= fio+fi 1 x 1 +fi 2 x 2 +e 
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labia 10-2 Datos de la viscosidad del ejemplo 10-1 (viscosidad en 


centistokes @ 100°C) 


Tfemperatura 

Velocidad de alimentacidn 


Observacidn (x l9 °C) 

del catalizador (x 2 , lb/h) 

Viscosidad 

1 

80 


8 

2256 

2 

93 


9 

2340 

3 

100 


10 

2426 

4 

82 


12 

2293 

5 

90 


11 

2330 

6 

99 


8 

2368 

7 

81 


8 

2250 

8 

96 


10 

2409 

9 

94 


12 

2364 

10 

93 


11 

2379 

11 

97 


13 

2440 

12 

95 


11 

2364 

13 

100 


8 

2404 

14 

85 


12 

2317 

15 

86 


9 

2309 

16 

87 


12 

2328 


a estos datos. La matriz X y el vector y son 


"1 

80 

8 " 


'2256 ' 

1 

93 

9 


2340 

1 

100 

10 


2426 

1 

82 

12 


2293 

1 

90 

11 


2330 

1 

99 

8 


2368 

1 

81 

8 


2250 

1 

96 

10 


2409 

1 

94 

12 

y = 

2364 

1 

93 

11 


2379 

1 

97 

13 


2440 

1 

95 

11 


2364 

1 

100 

8 


2404 

1 

85 

12 


2317 

1 

86 

9 


2309 

1 

87 

12 


2328 


La matriz X'X es 


’ 1 
80 

1 •• 

93 •• 

1 

87 

1 

1 

80 

93 

8' 

9 

8 

9 •• 

■ 12 

1 

87 

12 


XX = 
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16 

1458 

164 

1458 

133560 

14,946 

164 

14,946 

1,726 


y el vector X'y es 


x'y= 


1 1 
80 93 
8 9 


ill 2256 ' 

2340 

2 J 2328 


37,577 

2^429,550 

385,562 


La estimation de mmimos cuadrados de /J es 

^=(X'X)-‘X'y 


o 



14.176004 

-0.129746 

-0.223453 


-0.129746 
1.429184 xl0“ 3 
-4.763947 xlO -5 


-0.223453 
-4.763947 xlO -5 
2222381 xlO -2 


37,577 

3429,550 

385,562 


1566.07777 

7.62129 

8.58485 


El ajuste de minimos cuadrados, con los coeficientes de regresidn expresados con dos cifras decimates, es 


labia 10-3 Valores predichos, residuales y otros diagndsticos del ejemplo 10-1 


Observacidn 


Valor predicho 

Residual 


Residual 



i 

yt 

9, 


h* 

studentizado 

A 

R-student 

1 

2256 

2244.5 

11.5 

0.350 

0.87 

0.137 

0.87 

2 

2340 

2352.1 

-12,1 

0.102 

-0.78 

0.023 

-0.77 

3 

2426 

2414.1 

11,9 

0.177 

0.80 

0.046 

0.79 

4 

2293 

2294.0 

-1,0 

0.251 

-0.07 

0.001 

-0.07 

5 

2330 

2346.4 

-16.4 

0.077 

-1.05 

0.030 

-1.05 

6 

2368 

2389.3 

-21.3 

0.265 

-1.52 

0.277 

-1.61 

7 

2250 

2252.1 

-2.1 

0.319 

-0.15 

0.004 

-0.15 

8 

2409 

2383.6 

25.4 

0.098 

1.64 

0.097 

1.76 

9 

2364 

2385.5 

-21.5 

0.142 

-1.42 

0.111 

-1.48 

10 

2379 

2369.3 

9.7 

0,080 

0.62 

0.011 

0.60 

11 

2440 

2416.9 

23.1 

0.278 

1.66 

0.354 

1.80 

12 

2364 

2384.5 

-20.5 

0.0% 

-1.32 

0.062 

-1.36 

13 

2404 

2396.9 

7.1 

0,289 

0.52 

0.036 

0.50 

14 

2317 

2316.9 

0,1 

0.185 

0.01 

0.000 

<0.01 

15 

2309 

2298.8 

10.2 

0.134 

0.67 

0.023 

0.66 

16 

2328 

2332.1 

-4.1 

0.156 

-0.28 

0.005 

-0.27 
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Tabla 10-4 Salida de Minitab para el modelo de regresi6n de la viscosidad, ejemplo 10-1 

An&lisis de regresidn 


The regression equation is 

Viscosity = 1566 + 7-62 Temp + 8-58 Feed Rate 


Predictor 

Coef 

StDev 

T 

P 

Constant 

1566.08 

61 .59 

25.43 

0.000 

Temp 

7-6213 

0.6184 

12.32 

0.000 

Feed Rat 

8-585 

2.439 

3.52 

0.004 

S = 16-36 

R-Sq = 

92.7% 

R-Sq ( ad j ) 

= 91.6% 

Analysis of 

Variance 




Source 

t> F 

SS 

MS 

F 

Regression 

2 

44157 

22079 

82.50 

Residual £r 

ror 13 

3479 

268 


Total 

15 

47636 



Source 

DF Seq 

SS 



Temp 

1 40841 




Feed Rat 1 3316 


57 68 




Variables del proceso 


Variables codiflcadas 


Corrida Temperature {°C) 

Preston (pslg) 

Concentracton (g/l) 


*2 

*3 

y 

1 

120 

40 

15 

-1 

-1 

-1 

32 

2 

160 

40 

15 

1 

-1 

-1 

46 

3 

120 

80 

15 

-1 

1 

-1 

57 

4 

160 

80 

15 

1 

1 

-1 

65 

5 

120 

40 

30 

-1 

-1 

1 

36 

6 

160 

40 

30 

1 

-1 

1 

48 

7 

120 

80 

30 

-1 

1 

1 

67 

8 

160 

80 

30 

1 

1 

1 

68 

9 

140 

60 

22.5 

0 

0 

0 

50 

10 

140 

60 

22.5 

0 

0 

0 

44 

11 

140 

60 

22-5 

0 

0 

0 

53 

12 

140 

60 

22.5 

0 

0 

0 

56 


Temperature - 140 Preston- 60 Concentracton- 22 5 

20 ‘ Xl = 20 ' * ” 75 


P 

0-000 


Figura 10-5 Diseno experimental del ejemplo 10-2. 
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Ajuste de modelos de regresidn en experimentos disenados 

Se ha usado con frecuencia un modelo de regresidn para presentar los resultados de un experimento dise- 
nado en una forma cuantitativa. Se ofrece ahora un ejemplo completo donde se indica c6mo se hace esto. 
Se presentan enseguida otros tres ejemplos breves que ilustran otras aplicaciones utiles del an&lisis de re- 
gresidn en los experimentos disenados. 


EJEMPLO 10-2 

Andlisis de regresion de un diseno factorial 2 3 

Un ingeniero quimico esta investigando el rendimiento de un proceso. Tires de las variables del proceso 
son de interes: la temperatura, la presidn y la concentracidn del catalizador. Cada variable puede correrse 
en un nivel bajo y uno alto, y el ingeniero decide correr un diseno 2 3 con cuatro puntos centrales. En la fi- 
gura 10-5 se muestra el diseno y los rendimientos resultantes, donde se presentan tanto los niveles natura- 
les del diseno como la notacidn de variables codificadas +1,-1 que se utiliza normalmente en los disenos 
factoriales 2 k para representar los niveles de los factores. 

Suponga que el ingeniero decide ajustar un modelo que sdlo incluye los efectos principales, por ejemplo 

y= Po + &*1 + 02*2 +03*3 +« 


Para este modelo, la matriz X y el vector y son 


'1 

-1 

-1 

- 1 ' 


■ 32 ' 

1 

1 

-1 

-1 


46 

1 

-1 

1 

-1 


57 

1 

1 

1 

-1 


65 

1 

-1 

-1 

1 


36 

1 

1 

-1 

1 


48 

1 

-1 

1 

1 

y = 

57 

1 

1 

1 

1 


68 

1 

0 

0 

0 


50 

1 

0 

0 

0 


44 

1 

0 

0 

0 


53 

1 

0 

0 

0 


56 


Es sencillo demostrar que 


'12 0 0 O' 


612" 

0 8 0 0 

Xy = 

45 

0 0 8 0 

85 

0 0 0 8 


9 


Puesto que X'X es diagonal, el inverso que se requiere tambien es diagonal, y las estimaciones de minimos 
cuadrados de los coeficientes de regresibn son 


p=(X'xy l x'y = 


1/12 0 0 

0 1/8 0 

0 0 1/8 

0 0 0 1 



'612' 


r5i.oooi 


45 


5.625 


85 


10.625 


9 


1.125 


El modelo de regresibn ajustado es 

y= 51.000 + 5.625^ +10.625x 2 +1.125^ 
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Como se ha hecho uso de ellos en muchas ocasiones, los coeficientes de regresion guardan una estre- 
cha relation con las estimaciones de los efectos que se obtendnan por el analisis usual de un diseno 2 3 . Por 
ejetnplo, el efecto de la temperatura es (referirse a la figura 10-5) 

r = y T .-y. r 

= 56,75- 45.50 
= 11.25 

Observe que el coeficiente de regresion de x x es 

(11.25)/ 2 =5.625 

Es decir, el coeficiente de regresion es exactamente la mitad de la estimacion usual del efecto. Esto siem- 
pre se cumplirci para un diseno 2\ Como se senalo antes, en los capitulos 6 a) 8 se empleo este resultado 
para producir modelos de regresion, valores ajustados y residuales envarios experimentos de dos niveles, 
Este ejemplo demuestra que las estimaciones de los efectos de un diseno 2 k son estimaciones de mnrimos 
cuadrados. 


En el ejemplo 10-2 es sencillo obtener la matriz inversa porque X'X es diagonal. Intuitivamente, esto 
parece ofrecer ventajas, no solo porque los calculos se simplifican sino tambien porque los estimadores de 
todos los coeficientes de regresion no est£n correlacionados, es decir, Cov($, ft) = 0. Si los niveles de las 
variables x pueden elegirse antes de recabar los datos, quiza sea deseable disenar el experimento de tal 
modo que resulte una X'X diagonal. 

En la practica puede ser relativamente sencillo conseguir esto. Se sabe que los elementos de X'X que 
estiln fuera de la diagonal son las sumas de los productos cruzados de las columnas en X. For lo tanto, es 
necesario bacer que el producto interior de las columnas de X sean iguales a cero; es decir, estas columnas 
deben ser ortogonales. A los disenos experimentales que poseen esta propiedad para ajustar un modelo 
de regresion se les llama disenos ortogonales, En general, el diseno factorial 2 k es un diseno ortogonal 
para ajustar el modelo de regresidn lineal multiple. 

Los metodos de regresion son en extremo utiles cuando algo “sale mar en un experimento disenado, 
Esto se ilustra en los dos ejemplos siguientes. 


EJEMPLO 10-3 

Un diseno factorial 2 3 con una observacion faltante 

Considere el diseno factorial 2 3 con cuatro puntos centrales del ejemplo 10-2, Suponga que cuando se rea- 
lize este experimento, faltd la corrida con todas las variables en el nivel alto (la corrida 8 de la figura 10-5). 
Esto puede ocurrir por varias razones: el sistema de medicion puede producir una lectura incorrecta, la 
combinacidn de los niveles de los factores quiza no sea la apropiada, la unidad experimental puede estar 
danada, etcetera. 

Se ajustara el modelo de los efectos principals 

y = o + p2 X 2 + 


utilizando las 11 observaciones restantes. La matriz X y el vector y son 
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'1 

-1 

-1 

-1' 


" 32 ‘ 

1 

1 

-1 

-1 


46 

1 

-1 

1 

-1 


57 

1 

1 

1 

-1 


65 

1 

-1 

-1 

1 


36 

1 

1 

-1 

1 

y= 

48 

1 

-1 

1 

1 


57 

1 

0 

0 

0 


50 

1 

0 

0 

0 


44 

1 

0 

0 

0 


53 

1 

0 

0 

0 


56 


Para estimar los parametros del modelo se fonnan 



'll 

-1 

-1 

-1' 


' 544 ' 

xx= 

-1 

7 

-1 

-1 

Xy= 

-23 

-1 

-1 

7 

-1 

17 


-1 

-1 

-1 

7 


-59 


y entonces 

£ = (X'X) -1 X'y 


9.61538xl0’ 2 

1. 92307 XlO' 2 

1.92307 xlO’ 2 

1.92307 xlO’ 2 


[5441 

1. 92307 xlO -2 

0.15385 

2.88462 xlO’ 2 

2.88462 xlO’ 2 


-23 

1.92307 xlO’ 2 

2.88462X10' 2 

0.15385 

2.88462X10’ 2 


17 

1.92307 xl0“ 2 
[51.251 

2. 88462 xlO’ 2 

2. 88462 xlO’ 2 

0.15385 


-59 


5.75 

10.75 

1.25 


Por lo tanto, el modelo ajustado es 

y= 51.25+ 5.75^ +10. 75* 2 +1.25jc 3 

Compare este modelo con el que se obtuvo en el ejemplo 10-2, donde se usaron las 12 observaciones. Los 
coeficientes de regresion son muy similares. Debido a la estrecha relation entre los coeficientes de regre- 
si6n y los efectos de los factores, las conclusiones no sufririan una alteracidn sustandal por la observation 
faltante. Sin embargo, observe que las estimaciones de los efectos han dejado de ser ortogonales, ya que 
(X'X) y su inversa ya no son diagonales. 


IJEMPLO 10*4 

Niveles imprecisos de los factores del diseno 

Cuando se corre un experimento diseiiado, en ocasiones es diffcil alcanzar y mantener los niveles preci- 
sos de los factores requeridos por el diseno. Las discrepancias pequenas no son importantes, pero las 
grandes son motivo de preocupacion potencial. Los metodos de regresion son utiles en el analisis de un 
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Tabla 10' 5 Diseno experimental del ejemplo 10-4 


Corrida 

Variables del proceso 

Variables codificadas 

Rendimiento 

y 

Tbmperatura 

(°C) 

Presidn 

(psig) 

Concentracidn 

m 


* 2 

*3 

1 

125 

41 

14 

-0,75 

-0.95 

-1.133 

32 

2 

158 

40 

15 

0.90 

-1 

-1 

46 

3 

121 

82 

15 

-0.95 

1.1 

-1 

57 

4 

160 

80 

15 

1 

1 

-1 

65 

5 

118 

39 

33 

-1.10 

-1.05 

1.14 

36 

6 

163 

40 

30 

1.15 

-1 

1 

48 

7 

122 

80 

30 

-0.90 

1 

1 

57 

8 

165 

S3 

30 

1.25 

1.15 

1 

68 

9 

140 

60 

22.5 

0 

0 

0 

50 

10 

140 

60 

22.5 

0 

0 

0 

44 

11 

140 

60 

22.5 

0 

0 

0 

53 

12 

140 

60 

22,5 

0 

0 

0 

56 


experimento disenado cuando el experimentador no ha podido obtener los niveles requeridos de los 
factores. 

Para ilustrar, el experimento de la tabla 10-5 presenta una variacion del diseno 2 3 del ejemplo 10-2, 
donde muchas de las combinadones de prueba no son exactamente las que se espedfican en el diseno. 
Las dificultades parecen haber ocurrido sobre todo con la variable temperatura. 

Se ajustarS el modelo de los efectos principals 


y= Po + Pl*l + Pl X 2 + /M 3 +E 


La matriz X y el vector y son 



i 

-0.75 

-0.95 

-1.1331 


'32' 


i 

0.90 

-1 

-1 


46 


i 

-0.95 

1.1 

-1 


57 


i 

1 

1 

-1 


65 


i 

-1.10 

-1.05 

1.4 


36 

X = 

i 

i 

1.15 

-0.90 

-1 

1 

1 

1 

y = 

48 

57 


i 

1.25 

1.15 

1 


68 


i 

0 

0 

0 


50 


i 

0 

0 

0 


44 


i 

0 

0 

0 


53 


i 

0 

0 

0 


56 


Para estimar los par&metros del modelo se necesitan 


12 

0.60 

0.25 

0.2670' 


'612 ' 

0.60 

8.18 

0.31 

-0.1403 

Xy = 

77.55 

0.25 

0.31 

8.5375 

-0.3437 

161.50 

0.2670 

-0.1403 

-0.3437 

9.2437 


19.144 


X'X = 



Entonces 
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/j=(X'X) _ 1 x'y 


837447 xlO~ 2 
-6.09871 XlO" 3 
-2.33542 xl0~ 3 
— 2.59833xl0' 3 

'50.364961 

5.41932 

10.16672 

1.07653 


-6.09871 xlO' 3 
0.12289 

-4.20766 xlO' 3 
1.88490 XlO' 3 


-2.33542 XlO' 3 
-4.20766 XlO' 3 
0.11753 
4.37851 xlO' 3 


-2.59833X10 

1.88490X10 

4.37851X10 

0.10845 



"612 ' 


77.55 


161.50 


19.144 


El modelo de regresidn ajustado, con los coeficientes reportados con dos cifras decimates, es 

y= 50.36 +2x, +10.17x 2 +1.08* 3 

A1 comparar este resultado con el modelo original del ejemplo 10-2, donde los niveles de los factores fue- 
ron exactamente los que se especificaron en el diseno, se observa muy poca diferencia. La interpretation 
prSctica de los resultados de este experimento no sufriria alteraciones sustanciales por la incapacidad del 
experimentador para alcanzar exactamente los niveles deseados de los factores. 


EJEMPLO 10-5 

Separation de alias de interacciones en un diseno factorial fraccionado 

En el capltulo 8 se senalo la posibilidad de separar los alias de las interacciones de un diseno factorial 
fraccionado mediante el proceso llamado doblez o plegado. Para un diseno de resolution III, un plegado 
completo se construye corriendo una segunda fraction en la que los signos estan invertidos respecto de 
los signos de la fraction original. Entonces el diseno combinado puede usarse para separar los alias de to- 
dos los efectos principales de las interacciones de dos factores. 

Una dificultad con el plegado es que requiere un segundo grupo de corridas de tamano idOntico al del 
diseno original. Por lo general es posible separar los alias de ciertas interacciones de interns aumentando 
el diseno original con un numero de corridas menor que las que se requieren en un plegado completo. Los 
metodos de regresion son una forma facil de formular este problema y de ver como puede resolverse. 

Para ilustrar, suponga que se ha corrido un diseno 2^\ En la tabla 8-3 se muestra la fraction princi- 
pal de este diseno, en la que / = ABCD. Suponga que despues de que se observaron los datos de los ocho 
primeros ensayos, los efectos mas grandes fueron/4, B, C, D (se ignoran las interacciones de tres factores 
que son alias de estos efectos principales), y la cadena de aliases + CD. Las otras dos cadenas de alias 
pueden ignorarse, pero es claro qu eAB o CD o ambas interacciones de dos factores son grandes. Para di- 
lucidar cu tiles son las interacciones importantes podria, desde luego, correrse la fraction altema, para lo 
cual se requeririan otros ocho ensayos. Entonces las 16 corridas podrian usarse para estimar los efectos 
principales y las interacciones de dos factores. 

Es posible separar los alias d eAB y CD en un numero de ensayos adicionales menor que ocho. Supon- 
ga que quiere ajustarse el modelo 

y /Jo "¥ fl + £ 
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dondex 1 ,x 2 J x 3 yx 4 son las variables codificadas que representan aA, B, C y D. Utilizando el diseno de la ta- 
bla 8-3, la matriz X de este modelo es 


X, x 2 X 3 X 4 XiX 2 XjX 4 

n -i -i -i -i i i' 

1 1-1-1 1-1 -1 

1-1 1-1 1-1 -1 

1 1 1 - 1-1 1 1 

x_ 1 -1 -1 1 1 1 1 

1 1-1 1 - 1-1 -1 

1-1 1 1 - 1-1 -1 

1111111 


donde se han anotado las variables arriba de las columnas a fin de facilitar la comprensidn. Observe que la 
columnax 1 x 2 es iddntica a la columnax^ (como se anticipaba, ya que AB 0XjX 2 es alias de CD 0 x 3 X 4 ), 
lo c ual implica una dependencia lineal en las columnas de X. Por lo tanto, no pueden estimarse tanto j$ 12 
como /3 j 4 en el modelo. Sin embargo, suponga que se agrega la corrida unicaXi = -l,x 2 = -l,x 3 * -1 yx 4 = 
1 de la fraccidn altema a las ocho corridas originales. Entonces la matriz X del modelo queda como 


X, X 2 X 3 X 4 XjX 2 XjX 4 

Tl -1 -1 -1 -1 1 1 ' 

1 1 - 1-1 1-1 -1 

1-1 1-1 1-1 -1 

1 1 1 - 1-1 1 1 

X= 1 -1 -1 1 1 1 1 

1 1-1 1 - 1-1 -1 

1-1 1 1 - 1-1 -1 

1111111 
1 -1 -1 -1 1 1 -1 


Observe que ahora las columnas xix 2 yx^c 4 ya no son iddnticas, y el modelo puede ajustarse incluyendo a 
las dos interaccionesxiX 2 (AB) yxjx 4 (CD). Las magnitudes de los coeficientes de regresidn brindardn in- 
formation respecto a cu&les son las interacciones importantes. 

Aim cuando al agregar una sola corrida se separaran los alias de las interacciones ^! -6 y CD, este enfo- 
que tiene una desventaja. Suponga que existe un efecto de tiempo (o un efecto de bloque) entre las ocho 
primeras corridas y la ultima corrida que se agrego arriba. Al agregarse una columna a la matriz X para los 
bloques, se obtiene lo siguiente: 


x 2 x 2 x 3 x 4 XiX 2 X5X4 bloques 
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Se ha supuesto que el factor del bloque estaba en el nivel bajo o durante las ocho primeras corridas, y 
en el nivel alto o “+” durante la novena corrida, Es sencillo ver que la suma de los productos cruzados de 
cada columna con la columna del bloque no es cero, lo cual significa que los bloques han dejado de ser or- 
togonales para los tratamientos, o que el efecto del bloque afecta ahora a las estimaciones de los coefi- 
cientes de regresidn del modelo. Para conseguir la ortogonalidad de los bloques, debe agregarse un 
numero par de corridas. Por ejemplo, con las cuatro corridas 


*1 

* 2 

*3 

*4 

-1 

-1 

-1 

1 

1 

-1 

-1 

-1 

-1 

1 

1 

1 

1 

1 

1 

-1 


se separaran los alias de AB de CD y permitir£n que los bloques sean ortogonales (esto puede verse desa- 
rrollando la matriz X como se hizo anteriormente). 

En general, suele ser directo el examen de la matriz X del modelo reducido que se obtiene de un dise- 
no factorial fraccionado, asi como la determination de cuales son las corridas que habran de aumentarse 
en el diseno original para separar los alias de las interacciones de interes potencial. Ademas, el impacto de 
las estrategias especificas para aumentar el diseno puede evaluarse utilizando los resultados generales 
de los modelos de regresion que se presentan m&s adelante en este capitulo. Se cuenta tambien con meto- 
dos basados en computadora para construir disenos que pueden ser utiles en el aumento del diseno para 
separar los alias de los efectos. Estos disenos generados por computadora se revisar&n en el capitulo si- 
guiente. 


KM PRUEBA DE HIPOTESIS EN LA REGRESION MULTIPLE 

En los problemas de regresion lineal multiple, ciertas pruebas de hipotesis acerca de los parametros del 
modelo son una ayuda para medir la utilidad del modelo. En esta seccidn se describen varios procedi- 
mientos de prueba de hipotesis importantes. Estos procedimientos requieren que los errores e i del mode- 
lo sigan una distribution normal e independiente con media cero y varianza o 2 , lo cual se abrevia 
£ — NID(0, o 2 ). Como resultado de este supuesto, las observacionesy, tienen una distribucidn normal e in- 
dependiente con media /? 0 + y varianza a 2 . 


1(M*1 Prueba de significacion de la regresion 

La prueba de significacidn de la regresion es un procedimiento para detenninar si existe una relacidn li- 
neal entre la variable de respuestay y un subconjunto de los regresoresx 1? jc 2 , x k . Las hipdtesis apropia- 
das son 


H 0 :(J 1 = fi 2 = - = (} k =0 

0 para al menos una j 


( 10 - 20 ) 


Elrechazo d eH 0 de la ecuacion 10-20 implica que al menos uno de los regresores*!,^, ...,x k contribuye de 
manera significativa al modelo. El procedimiento de prueba incluye un analisis de varianza en el que se 
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hace la partition de la suma de cuadrados total SS T en una suma de cuadrados debida al modelo (o a la re- 
gresion) y una siuna de cuadrados debida a los residuales (o al error), es detir, 

SS T =SS R +SS E (10-21) 


Ahora bien, si la hipotesis nula//,,:/?! = /} 2 = ... = 0 k = Oes verdadera, entonces SS^o 2 se distribuye como 
xl, donde el numero de grades de libertad para y 2 es igual al numero de regresores del modelo. Asimis- 
mo, puede demostrarse que SS E /o 2 se distribuye como xl-k-i Y I 116 Y son independientes. El pro- 
cedimiento de prueba para //„:/?! = /? 2 = • = Pk = 0 consiste en calcular 


SS g /k _MS r 
SS £ /( n-k-l)~ MS e 


( 10 - 22 ) 


y en rechazar f/ 0 si F a excede a F akn _ k _ 1 . De manera alternativa, podria usarse el enfoque del valorPpara 
la prueba de hipotesis y, por lo tanto, rechazar // 0 si el valor P del estadistico F 0 es menor que a. Por lo ge- 
neral la prueba se resume en una tabla del an til i sis de varianza como la tabla 10-6. 

Es sencillo encontrar una formula para calcular SS R . En la ecuacion 10-16 se establecio una formula 
para calcular SS E ; es decir, 

SS E =y'y-P'X’y 


Ahora bien, puesto que SS T = 2" =1 yf - (2" =1 y.) 2 /n= y'y - (Z" =1 y, f / n, la ecuacidn anterior puede 
reescribirse como 


SS E = y'y 



frx'y- 



n 


o 

SS E = SS T - SS R 

Por lo tanto, la suma de cuadrados de regresion es 

SS R = ft'X'y- 

mientras la suma de cuadrados del error es 

SS E = y'y-p'X'y 



(10-23) 


(10-24) 


Tabla KV6 Analisis de varianza de la significacidn de la regresidn en una regresidn multiple 

Fuente de variacidn 

Suma de cuadrados 

Grados de libertad 

Cuadrado medio 

F o 

Regresidn 

SS R 

k 

ms r 

ms r /ms e 

Error o residual 

ss E 

n-k-l 

ms e 


Total 

SS T 

n - 1 
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y la suma de cuadrados total es 


SS T = y'y- 



(10-25) 


Estos calculos casi siempre se realizan con software de regresidn, Por ejemplo, en la tabla 10*4 se 
muestra una parte de la salida de Minitab para el modelo de regresidn de la viscosidad del ejemplo 10-1, 
La seccidn superior de esta presentacidn es el an&lisis de varianza del modelo. La prueba de significacidn 
de la regresidn en este ejemplo incluye las hipdtesis 

= ** 0 

* 0 para al menos una j 


El valor P de la tabla 10-4 para el estadistico F (ecuacion 10-22) es muy pequeno, por lo que se concluiria 
que al menos una de las dos variables — la temperatura (x : ) y la velocidad de alimentation (x 2 )— tiene un 
coeficiente de regresion diferente de cero. 

En la tabla 10-4 se presenta tambiSn el coeficiente de determination multiple R 2 , donde 


R 2 


ss* ss, 

SS T SS T 


(10-26) 


Como en los experimentos disenados, R 2 es una medida de la cantidad de reduction en la variabilidad de v 
que se obtiene al utilizar las variables de regresidn x u x 2 , ...,x k en el modelo. Sin embargo, como se senal6 
antes, un valor grande de R 2 no implica necesariamente que el modelo de regresidn sea adecuado. Siem- 
pre que se agregue una variable al modelo, R 2 se incrementara, independientemente de que la variable 
adicional sea estadisticamente significativa o no. Por lo tanto, es posible que los modelos que tienen valo- 
res grandes de R 2 produzcan predicciones pobres de nuevas observaciones o estimaciones pobres de la 
respuesta media. 

Puesto que R 2 siempre se incrementa cuando se agregan terminos al modelo, algunos constructores 
de modelos de regresion prefieren usar el estadistico R 1 ajustada definido como 


R 2 

ajustada 


SSs/jn-p) 
SS T /(n- 1) 


n - 1 
n — p 


1 -R 2 ) 


(10-27) 


En general el estadistico R 2 ajustada no siempre se incrementara cuando se agreguen variables al mode- 
lo. De hecho, si se agregan t6nninos innecesarios, el valor de ^ juBtada se decrementara con frecuencia, 

Por ejemplo, considere el modelo de regresidn de la viscosidad. La R 2 ajustada para el modelo se 
muestra en la tabla 10-4. Se calcula como 


R 2 

’^'’ajustada 


= 1 - 


n - 1 


n-p 


(1 -R 2 ) 


= 1 "(i) (1 “ a92697) 

= 0.915735 


que estci muy cerca de la R 2 ordinaria. Cuando la diferencia entre R 2 y R j iu „„ d „ es considerable, existe un 
buen riesgo de que se hayan incluido en el modelo tdrminos no significativos. 
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10-4.2 Pruebas de los coeficientes de regresion individuales 
y de grupos de coeficientes 

Muchas veces el interes se centra en probar hipotesis sobre los coeficientes de regresion individuales. 
Estas pruebas serfan utiles para determinar el valor de cada uno de los regresores del modelo de regre- 
sion. Por ejemplo, el modelo podria ser mas eficaz con la inclusion de variables adicionales o quiza con la 
elimination de una o mas de las variables que estan ya en el modelo. 

Agregar una variable al modelo de regresion ocasiona siempre que la suma de cuadrados de regre- 
sion se incremente y que la suma de cuadrados del error se decremente. Es necesario decidir si el incre- 
mento de la suma de cuadrados de regresion es suficiente para garantizar el uso de la variable adicional 
en el modelo. Ademas, agregar una variable no importante al modelo en realidad puede incrementar el 
cuadrado medio del error, reduci6ndose asi la utilidad del modelo. 

Las hipotesis para probar la signification de cualquier coeficiente de regresion individual, por ejem- 
plo /(-, son 

H o :0j = 0 

H 


Si H 0 :f}j = 0 no se rechaza, entonces esto indica quex, puede eliminarse del modelo. El estadistico de prue- 
ba para esta hipotesis es 



(10-28) 


donde C jt es el elemento de la diagonal de (X'X)" 1 correspondiente a fij . La hipotesis nula/f 0 :/? ; = 0 se re- 
chaza si 1 1 0 1 > t al 2 ,„-k-v Observe que se trata en realidad de una prueba parcial o marginal, ya que el coefi- 
ciente de regresion depende de todos los dem as regresores x, (i * j) que est&n en el modelo. 

Al denominador de la ecuacidn 10-28, ■ y Jd i C jj , se le llama con frecuencia error estandar (se) del coe- 
ficiente de regresidn Es detir, 

se(0j)=J¥c: (10-29) 


Por lo tanto, una manera equivalente de escribir el estadistico de prueba de la ecuacion 10-28 es 


1 0 


Pj 


(10-30) 


La mayoria de los programas de computadora de regresion proporcionan la prueba t para cada para- 
metro del modelo. Por ejemplo, considere la tabla 10-4, la cual contiene la salida de Minitab para el ejem- 
plo 10-1. En la section superior de esta tabla se da la estimation de mmimos cuadrados de cada 
parametro, el error estandar, el estadistico t y el valor P correspondiente. Se concluiria que ambas varia- 
bles, la temperatura y la velocidad de alimentacidn, contribuyen de manera significativa en el modelo . 

Ihmbitii puede examinarse directamente la contribution de una variable particular, por ejemplo Xj, a 
la suma de cuadrados de regresion, dado que otrasx, variables (i ^ j) estan incluidas en el modelo. El pro- 
cedimiento para hacer esto es la prueba general de la signification de la regresidn o, como se denomina 
con frecuencia, el metodo de suma de cuadrados extra. Este procedimiento tambien puede usarse para 
investigar la contribution de un subconjunto de los regresores al modelo. Considere el modelo de regre- 
si6n con k regresores: 


y = Xfi+e 
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donde y es (n x 1), X es (n x p),fa es (px 1), e es (n x 1) yp = k + 1. Querria determinarse si el subcon- 
junto de regresores x u x 2 , ...,x r (r < k) contribuye significativamente al modelo de regresion. Sea que se 
haga la particidn del vector de los coeficientes de regresion de la siguiente manera: 



donde /J, es (r x 1) y fa 2 es [(p - r) x 1]. Quieren probarse las hipdtesis 

H o‘fii = 0 (10-31) 

Hi-fi i^O 

El modelo puede escribirse como 

y = Xfa+e = X i fa 1 +X 2 0 2 +e (10-32) 

donde X x representa las columnas de X asociadas con /?, y X 2 representa las columnas de X asociadas 
con p 2 . 

Para el modelo complete (incluyendo tanto a f} x como a fa) se sa be que p = (X'X) 1 X'y. Ademas, la 
suma de cuadrados de regresi6n para todas las variables incluyendo la ordenada al origen es 

SS R (fi) = fi'X'y (p grados de libertad) 


y 


ms e = 


j'y-fix'y 

n-p 


A SS K (fi) se le llama la suma de cuadrados de regresion debida a/3. Para encontrar la contribucidn de los 
terminos en/3j a la regresidn, se ajusta el modelo suponiendo que la hipotesis nula H 0 p 1 = 0 es verdadera. 
El modelo reducido se encuentra a partir de la ecuacion 10-32 con fa = 0: 

y = X 2 fi 2 +e (10-33) 

El estimador de mlnimos cuadrados de fa es fa = (X' 2 X 2 )' 1 X' 2 y ) y 

SS R (fi 2 ) = ^' 2 X' 2 y (p - r grados de libertad) (10-34) 


La suma de cuadrados de regresion debida a fa dado que fa, esta ya en el modelo es 


SS R (fii\fi2)~SS R (0)-SS R (fi 2 ) 


(10-35) 


Esta suma de cuadrados tiene r grados de libertad. Es la “suma de cuadrados extra” debida &fa v Observe 
que SS R (fii |/J 2 ) es el incremento en la suma de cuadrados de regresidn debido a la inclusidn de las varia- 
bles x u x 2 , ■■■> x r en el modelo. 

Ahora bien, SS R 0 1 \ fi 2 ) es independiente de MS E , y la hipdtesis nula^j = 0 puede probarse con el es- 
tadistico 


Fo = 


SfajfafaVr 

MS, 


(10-36) 


Si F 0 > F a ,r,n- P > se rechaza// 0 , y se concluye que al menos uno de los parlmetros cnfa l es diferente de cero 
y, por consiguiente, al menos una de las variables jc!,a: 2 , ...,x r en X! contribuye significativamente al modelo 
de regresidn. Algunos autores llaman a la prueba de la ecuacidn 10-36 la prueba F parcial. 
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La prueba impartial es muy btil. Puede usarse para medir la contribucibn de jc ; como si fuera la ultima 
variable que se agregb al modelo, calculando 

SSr(0j\0o* 0i* •••* 0j-\* Pj+i’ 0k) 

fete es el incremento en la suma de cuadrados de regresibn debido a que se agrega*, a un modelo que ya 
contiene ax,, ...,x j _ l ,x j + l , ...,x k . Observe que la prueba F partial de una sola variables, es equivalente a la 
prueba t de la ecuacibn 10-28. Sin embargo, la prueba F parcial es un procedimiento mas general por 
cuanto puede medir el efecto de conjuntos de variables. 


EJEMPLO 10-6 

Considere los datos de la viscosidad del ejemplo 10-1. Suponga que se quiere investigar la contribucibn de 
la variable^ (veloddad de alimentacion) al modelo. Es decir, las hipotesis que quieren probarse son 

H o :0 2 =O 

Hi' 02^ 0 

Esto requerira la suma de cuadrados extra debida a /? 2 , o 

SSM0U 0o)~ sSr(0o* 01* 0 2 yss R (fi o> 

= ss R (0 l ,fi 2 \fi o )~ssMp o ) 

Entonces, por la tabla 10-4, donde se probb la significacibn de la regresibn, se tiene 

SS R (0 u 0 2 \0o) = 44,157.1 

a la que se llam6 en la tabla la suma de cuadrados del modelo. Esta suma de cuadrados tiene dos grados 
de libertad. 

El modelo reducido es 

y=0 o +0 1 x l +e 

El ajuste de mmimos cuadrados de este modelo es 

y= 1652.3955+ 7. 6397;^ 

y la suma de cuadrados de regresibn para este modelo (con un grado de libertad) es 

SSMI3 0 )= 4Q840.8 

Observe que SS R (pi |/S 0 ) se muestra en la parte inferior de la salida de Minitab de la tabla 10-4 bajo el en- 
cabezado “Seq SS”. Por lo tanto, 

SS R (0 2 \0 O ,0 1 )= 44,157.1 - 40,840.8 
* 3316.3 


con 2-1 = 1 grado de libertad. fete es el incremento en la suma de cuadrados de regresibn que resulta de 
agregar x 2 a un modelo que contenla ya ax b y se muestra en la parte inferior de la salida de Minitab en la 
tabla 10-4. Para probar H 0 :/3 2 = 0, por el estadistico de prueba se obtiene 


F o = 


MS, 


3316.3/1 

267.604 


= 12.3926 


Observe que en el denominador deF„ se usaM5 E del modelo completo (tabla 10-4). Entonces, puesto que 
F0.054.j3 = 1-67, se rechazarfa/7 0 ^2 = 0y se concluiria quex 2 (velocidad de alimentacion) contribuye signi- 
ficativamente al modelo. 



10-5 INTERVALOS DE CONFIANZA EN REGRESIONES MOLTIPLES 415 


Debido a que esta prueba F parcial incluye un solo regresor, es equivalente a la prueba t porque el 
cuadrado de una variable aleatoria t con v grados de libertad es una variable aleatoria F con 1 y v grados 
de libertad. Para ver esto, observe, por la tabla 10-4, que el estadistico t para H 0 :(i 2 = 0 dio como resultado 
t 0 = 3-5203 y que t 2 0 = (3.5203) 2 = 12.3925 =F 0 . 


1 0'5 INTERVALOS DE CONFIANZA EN REGRESIONES MULTIPLES 


Con frecuencia es necesario construir estimaciones de intervalos de confianza para los coeficientes de re- 
gresion {fi : \ y para otras cantidades de interns del modelo de regresidn. El desarrollo de un procedimien- 
to para obtener estos intervalos de confianza requiere suponer que los errores {e,} tienen una 
distribution normal e independiente con media cero y varianza a 2 , el mismo supuesto que se establecid en 
la secckm sobre la prueba de hipdtesis de la seccidn 10-4. 


10'5.1 Intervalos de confianza para los coeficientes de regresidn individuates 

Puesto que el estimador de minimos cuadrados^es una combination lineal de las observaciones, se sigue 
que $tiene una distribucidn normal con vector medio fi y matrix de covarianza cr(X'X) Entonces cada 
uno de los estadisticos 



; = 0, 1, ..., k 


(10-37) 


se distribuye como tconn-p grados de libertad, donde C u es el elemento (y)-esimo de la matriz (X'X)' 1 , y 
o es la estimation de la varianza del error, obtenida con la ecuacion 10-17. Por lo tanto, un intervalo de 
confianza de 100(l-a) por ciento para el coeficiente de regresion / 3 y , j - 0, 1, ..., k, es 

Pi ~ s Pj £ pj +t all ' H _ p ^a 1 C u (10-38) 

Observe que este intervalo de confianza tambi6n podrfa escribirse como 

Pi - t a n ,n-p se CP } )^Pj^ Pi +t al2n _ p seCp j ) 

ya qu t se(P = . 


EJEMPLO 

Se construirA un intervalo de confianza de 95% para el parAmetro ft del ejemplo 10-1. Ahora bien, ft = 
7.62129, y puesto que d 2 = 267.604 y C n = 1.429184 x 10“ 3 , se encuentra que 

Pi — 1 0,025.13 C n — Pi ^ft + .025,13 

7.62129- Z16V(267.604)(1.429184xl0" 3 ) < ft 

£ 7.62129 + 216-^(267. 604)(1.429184 x 10" 3 ) 

7.62129- 216(0.6184) S ft s 7.62129 + 216(0.6184) 

y el intervalo de confianza de 95% para ft es 

6.2855s ft £ 8.9570 



416 CAPfTULO 10 AJUSTE DE MODELOS DE REG RES ION 


10-5.2 Intervalo de confianza para- la respuesta media 

Thm hiAn puede obtenerse un intervalo de confianza para la respuesta media en un punto particular, por 
ejemplo, jc 01 , * 0 2 > •••> *<*• Se define primero el vector 

T 1 ' 

-*-oi 



*o*J 


La respuesta media en este punto es 

= /^o + ^~Pl X 02 "*■■■■ +fik x 0k ~ X O0 

La respuesta media estimada en este punto es 

< 10 - 39 

Este estimador es insesgado, ya que £[K x o )]= E ( x '«P) =x 'afi = M y \ X(l > y vananza de y(xo) es 

nx x o)]=^ 2x ;( x ' x r lx o ( 10 ' 4 °) 

Por lo tanto, un intervalo de confianza de 100(1 - a) por ciento para la respuesta media en el punto x^x^, 
x 0k es ____ 

X X 0 )~~ *a/2,n-p x7 < ft ^ (10-41) 

£K x o)+w,^ 2x U x ' x r lx T 

10-6 PREDICCION DE NUEVAS OBSERVACIONES DE LA RESPUESTA 

Es posible usar un modelo de regresidn para predecir observaciones futuras de la respuesta y que corres- 
ponden avalores particulares de los regresores, por ejemplo x^x^, ...,Xo*. Si x' 0 = [l,x 01 ,Xg 2 , •■-.-bul. enton- 
ces una cstimacion puntual de la observation futuray 0 en el punto x 01 , x I)2 , ■--,x nk se calcula con la ecuacion 
10-39: 

X x o)= x 'J 

Un intervalo de predicci6n de 100(1— tr) por ciento para esta observation futura es 

K x 0 )- t an,n-p Vd 2 (l +x;(X'X) _1 x 0 ) < y 0 (10-42) 

s K X 0 ) + ‘ a , 2,n- P 4? (1 + x i ( x ' x r r ^) 

Cuando se predicen nuevas observaciones y se estima la respuesta media en un punto dadox 01? x 02 , 
x 0k , es necesario tener cuidado para no hacer una extrapolacidn fuera de la region que contiene las obser- 
vaciones originales, Es muy posible que un modelo que se ajuste bien en la regidn de los datos originates 
deje de hacerlo fuera de esa regidn. 

10-7 DIAGNOSHCOS DEL MODELO DE REGRESI6N 

Como se destac6 en los experimentos disefiados, la verificacidn de la adecuacidn del modelo es una parte 
importante en el procedimiento del anSlisis de datos. Es de igual importance en la construccidn de mo- 
delos de regresidn y, como se ilustrd en el ejemplo 10-1, en un modelo de regresion deberan examinarse 
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siempre las graflcas de los residuales que se usaron en los experimentos disenados. En general, siempre 
es necesario: 1) examinar el modelo ajustado para asegurarse de que proporciona una aproximaci6n ade- 
cuada del verdadero sistema y 2) verificar que no se infringe ninguno de los supuestos de la regresidn de 
minimos cuadrados. El modelo de regresion probablemente producira resultados pobres o equivocados a 
menos que sea un ajuste adecuado. 

Ademas de las graficas de los residuales, existen otros diagndsticos del modelo que con frecuencia 
son utiles en la regresion. En esta seccion se presenta un breve resumen de estos procedimientos. Para 
analisis mas completos, ver Montgomery y Peck [82] y Myers [84]. 


10-7.1 Residuales escalados y PRESS 
Residuales estandarizados y studentizados 

Muchos constructores de modelos prefieren trabajar con residuales escalados en lugar de los residuales 
de minimos cuadrados ordinarios. Estos residuales escalados transmiten con frecuencia mas information 
que los residuales ordinarios. 

Un tipo de residual escalado es el residual estandarizado: 

d t =j i = l,2,,..,n (10-43) 

donde por lo general se usa d = JMS E en los calculos. Estos residuales estandarizados tienen media cero 
y varianza aproximadamente unitaria; por consiguiente, son muy utiles para buscar puntos atipicos. La 
mayoria de los residuales estandarizados deberdn localizarse en el intervalo -3 < d, < 3, y cualquier ob- 
servation con un residual estandarizado que este fuera de este intervalo es potencialmente inusual con 
respecto a su respuesta observada. Estos puntos atipicos deberan examinarse con atencion, ya que pue- 
den representar algo tan simple como un error al registrar los datos o algo que sea motivo de mayor preo- 
cupacion, como una regi6n del espacio del regresor, donde el modelo ajustado es una aproximacion 
pobre de la verdadera superficie de respuesta. 

El proceso de estandarizaci6n de la ecuacidn 10-43 escala los residuales al dividirlos por su desvia- 
cion estandar promedio aproximada. En algunos conjuntos de datos, los residuales pueden tener desvia- 
ciones estandar que difieren considerablemente. A continuation se presenta una escalation que toma en 
consideration esta situacidn. 

El vector de los valores ajustados y. que corresponden a los valores observados y, es 

=X(X'X)-' X'y (10-44) 

= Hy 

A la matriz n x n, H = X(X'X) _1 X' se le llama generalmente la matriz “gorro” porque mapea el vector de 
los valores observados en un vector de los valores ajustados. La matriz gorro y sus propiedades desempe- 
nan un papel central en el an&lisis de regresi6n. 

Los residuales del modelo ajustado pueden escribirse convenientemente en la notacidn matricial 
como 

e = y - y 

y resulta que la matriz de covarianza de los residuales es 

Cov(e) = a 2 (I- H) (10-45) 

La matriz I - H no es por lo general diagonal, por lo que los residuales tienen varianzas diferentes y estdn 
correlacionados. 
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Por lo tanto, la varianza del residual i-bsimo es 

F(e,.)=a 2 (l-^) (10-46) 

donde h u es el elemento i-esimo de la diagonal de H. Puesto que 0 ^ h u < 1, al utilizar el cuadrado medio 
residual MS E para estimar la varianza de los residuales en realidad se esta sobreestimando K(e,). Adembs, 
puesto que h u es una medida de localizacibn del punto i-dsimo en el espacio x, la varianza de e, depende de 
d6nde este el punto x,. En general, los residuales situados cerca del centro del espacio at tienen varianzas 
m&s grandes que los residuales situados en lugares mbs apartados. Las violaciones de los supuestos del 
modelo son mbs probables en los puntos remotos, y estas violaciones pueden ser difitiles de detectar por 
la inspection de e, (o d t ) porque sus residuales seran por lo general mis pequenos. 

Se recomienda tomar en consideration esta desigualdad de la varianza cuando se escalen los residua- 
les. Se sugiere graficar los residuales studentizados: 

i = 1, 2,..., n (10-47) 

con a 1 = MS e en lugar de e t (o d,). Los residuales studentizados tienen varianza constante V(r t ) - 1 inde- 
pendientemente de la localizacibn de x, cuando la forma del modelo es correcta. En muchas situations la 
varianza de los residuales se estabiliza, en particular para conjuntos de datos grandes. En estos casos pue- 
de haber poca diferencia entre los residuales estandarizados y los studentizados. Por lo tanto, los residua- 
les estandarizados y studentizados transmiten con frecuencia informacibn equivalente. Sin embargo, ya 
que cualquier punto con un residual grande y una h u grande tiene una influencia potencialmente conside- 
rable sobre el ajuste de minimos cuadrados, suele recomendarse el examen de los residuales studentiza- 
dos. En la tabla 10-3 se presentan las diagonales gorro h u y los residuales studentizados para el modelo de 
regresibn de la viscosidad del ejemplo 10-1. 



Residuales PRESS 

La suma de cuadrados del error de prediccibn (PRESS, del ingles Prediction Error Sum of Squares) pro- 
porciona una util escalacibn de los residuales. Para calcular la PRESS se selecciona una observation, por 
ejemplo la i. Se ajusta el modelo de regresibn a las n - 1 observations restantes y se usa esta ecuacion 
para predecir la observaci6n que se apartby,. Al denotar este valor predicho y (i) , puede encontrarse el 
error de predictibn del punto i como e (i) = y, = j> (i) . Al error de prediccibn suele llamarsele el residual 
PRESS i-bsimo. Este procedimiento se repite para cada observacibn i = 1,2,..., n, producibndose un con- 
junto de n residuales PRESS e (1) , e (2) , ..., e (n) . Entonces el estadfstico PRESS se define como la suma de 
cuadrados de los n residuales PRESS como en 

PRESS = £<>=2 [*->,„]* (10-48) 

i = 1 1 = 1 

Por lo tanto, la PRESS utiliza cada subconjunto posible den-1 observationes como un conjunto de datos 
de es timaci bn, y se utiliza una observacibn a la vez para formar un conjunto de datos de prediccibn. 

Inicialmente, pareceria que para calcular la PRESS es necesario ajustar n regresiones diferentes. Sin 
embargo, la PRESS puede calcularse a partir de los resultados de un solo ajuste de minimos cuadrados a 
las n observationes totales. Resulta que el residual PRESS /-esimo es 



(10-49) 


Por lo tanto, ya que la PRESS es tan sblo la suma de cuadrados de los residuales PRESS, una formula de 
c&lculo simple es 

PRESS = 



1-h. 


(10-50) 
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Por la ecuacion 10-49 es sencillo ver que el residual PRESS es s61o el residual ordinario ponderado de 
acuerdo con los elementos de la diagonal de la matriz gorro h u . Los puntos de los datos para los que h a es 
grande tendrdn residuales PRESS grandes. Estas observaciones ser&n por lo general puntos de alta in- 
fluencia. En general, una diferencia grande entre el residual ordinario y los residuales PRESS indicara un 
punto donde el modelo se ajusta bien a los datos, pero un modelo construido sin dicho punto producira 
predicciones pobres. En la siguiente section se estudiar&n otras medidas de influencia. 

Por ultimo, cabe senalar que la PRESS puede usarse para calcular una R 2 aproximada de prediccibn, 
por ejemplo 

d2 - 1 PRESS 

^Prediccidn — r. (iU-M) 


Este estadlstico ofrece cierto indicio de la capacidad predictiva del modelo de regresibn. Para el modelo 
de regresion de la viscosidad del ejemplo 10-1, los residuales PRESS pueden calcularse utilizando los re- 
siduales ordinarios y el valor de h u encontrado en la tabla 10-3. El valor correspondiente del estadlstico 
PRESS es PRESS = 5207.7. Entonces 


R 2 

Prediccibn 


PRESS 

5207.7 

47,635.9 


= 0.8907 


Por lo tanto, podria esperarse que este modelo “explique” cerca de 89% de la variabilidad al predecir 
nuevas observaciones, en comparacibn con el aproximadamente 93% de la variabilidad en los datos origi- 
nates que explica el ajuste de minimos cuadrados. La capacidad predictiva global del modelo basado en 
este criterio parece ser muy satisfactory. 


R-student 

Es comun considerar al residual studentizado r, comentado antes como el diagnostico de un punto atipi- 
co. Se acostumbra usar MS E como una estimacion de a 2 en el calculo de r t . Se hace referenda a este enfo- 
que como la escalacibn interna del residual, ya que MS E es una estimacibn de oi 2 generada internamente 
que se obtiene del ajuste del modelo a las n observaciones. Otro enfoque seria usar una estimacibn de er 
basada en un conjunto de datos en el que se elimina la observacibn z-esima. La estimacibn de a 2 asi obteni- 


da se denota por S 


(«') 


Puede demostrarse que 

(n-p)M S E -e?l(l-h u ) 


S 2 = 
* (0 


n— p - 1 


(10-52) 


La estimacibn de o 2 de la ecuacion 10-52 se usa en lugar de MS E para producir un residual studentizado 
extemamente, al que es comun llamar R-student, dado por 

t, *= , . e ‘ / = 1, 2,..., n (10-53) 


(i K) 


En muchas situaciones habra una ligera diferencia entre f, y el residual studentizado r t . Sin embargo, 
si la observacibn i-esima es influyente, entonces S 2 n puede diferir significativamente de MS E , y por lo tan- 
to la R-student ser& m^s sensible a este punto. Ademas, bajo los supuestos usuales, t, tiene una distribu- 
cibn t n _p_ x . Por lo tanto, la R-student ofrece un procedimiento mas formal para detectar puntos atipicos a 
travbs de la prueba de hipbtesis. En la tabla 10-3 se muestran los valores de la R-student para el modelo de 
regresibn de la viscosidad del ejemplo 10-1. Ninguno de esos valores es inusualmente grande. 


420 CAPfTULO 10 AJUSTH dh modhlos de regresion 

10*7*2 Diagnosticos de influencia 

En ocasiones se encuentra que un subconjunto pequeno de los datos ejerce una influencia desproporcio- 
nada sobre el modelo de regresion ajustado. Es detir, las estimaciones o predicciones de los parametros 
pueden depen der mas del subconjunto influyente que de la mayoria de los datos. Seria conveniente loca- 
lizar estos puntos influyentes y valorar su impacto en el modelo. Si estos puntos influyentes son valores 
“malos”, deberan eliminarse. Por otra parte, quiza no haya nada rnalo con estos puntos. Pero si controlan 
propiedades clave del modelo, seria deseable saberlo, ya que podria afectar el uso del modelo. En esta 
section se describen e ilustran algunas medidas utiles de influencia. 


Puntos de accidn de palanca 

La localization de los puntos en el espaciox es importante para detefminar las propiedades del modelo. En 
particular, las observaciones apartadas tienen potencialmente acciones o brazos de palanca desproporcio- 
nados sobre las estimaciones de los parametros, los valores predichos y los estadfsticos de resumen usuales. 

La matriz gorro H = X(X'X)“ A X' es muy util para identificar las observaciones influyentes. Como ya 
se senalo, H determina las varianzas y covarianzas de y y e, ya que V(f) = a 2 !! y V(e) = o 2 ( I - H). Los ele- 
ments h tj de H pueden interpretarse como la cantidad de accion de palanca ejercida pory ; sobre y . . Por lo 
tanto, la inspection de los elementos de H puede revelar puntos que son potencialmente influyentes en 
virtud de su localization en el espaciox. La atencidn suele centrarse en los elementos de la diagonal h u . 
Puesto que Z" =1 h u - rango(H) - rango(X) = p 7 el tamano promedio de los elementos de la diagonal de la 
matriz H es pin. Como guia aproximada, entonces, si un elemento h u de la diagonal es mayor que 2 pin, la 
observation i es un punto con accion de palanca alta. Para aplicar lo anterior al modelo de la viscosidad 
del ejemplo 10-1, observe que 2 p/n — 2(3)/16 = 0.375. En la tabla 10-3 se dan las diagonales gorro h d para 
el modelo de primer orden; puesto que ninguna de las h u excede 0.375, se concluiria que no hay puntos de 
accion de palanca en estos datos. 


Influencia sobre los coeficientes de regresion 

Las diagonales gorro identificar&n los puntos potencialmente influyentes debido a su localizacidn en el 
espaciox. Es deseable considerar la localization del punto y la variable de respuesta cuando se mide la in- 
fluencia. Cook [32a, b] ha sugerido el uso de una medida fa del cuadrado de la distancia entre la estima- 
tion de mmimos cuadrados basada en todos los n puntos y la estimation obtenida al eliminar el punto i 7 
por ejemplo fa (i) . Esta medida de la distancia puede expresarse como 


D = 




pMS E 


i = 1, 2, 


(10-54) 


Un valor de referenda razonable para D, es la unidad. Es dedr, en general las observadones para las que 
A > 1 se consideran influyentes. 

El estadfstico D t se calcula en realidad a partir de 


_ r_[ VlSjx , )] _ r, 2 h H 
p F(e, ) p (1 ~h u ) 


i = l, 2, n 


(10-55) 


Observe que, aparte de la constante p, A es el producto del cuadrado del residual studentizado /-esimo y 
h u /(l-h u ). Puede demostrarse que este cociente es la distancia del vector x, al centroide de los datos res- 
tantes. Por lo tanto, A esta compuesto por un componente que refleja la medida en que el modelo ajusta 
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la observacidn /-6simay, y un componente que mide que tan alejado est& ese punto del resto de los datos. 
Cualquiera de los componentes (o ambos) puede contribuir a un valor grande de 

En la tabla 10-3 se muestran los valores de D { para el ajuste del modelo de regresidn a los datos de la 
viscosidad del ejemplo 10-1. Ninguno de estos valores de D L excede 1, por lo que no hay evidencia solida 
de observaciones influyentes en estos datos. 
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En la section 6-6 se indicd c6mo agregar puntos centrales a un diseno factorial 2 k le permite al experimen- 
tador obtener una estimacidn del error experimental puro. Esto permite hacer la partition de la suma de 
cuadrados de los residuales SS E en dos componentes; es decir, 

SS E = SS fe + SS LOF 

donde SS PE es la suma de cuadrados debida al error puro y SS L0F es la suma de cuadrados debida a la falta 
de ajuste. 

Puede presentarse un desarrollo general de esta particidn en el contexto de un modelo de regresidn. 
Suponga que se tienen n { observaciones de la respuesta en el nivel z-6simo de los regresores x (7 i = 1, 2, 
m.Seaquey iy denotalaobservaci6ny-esimade la respuesta en x„ i = l,2,...,myj = 1,2,..., it,. Hay n =2^ 
rii observaciones en total. El residual (y)-esimo puede escribirse como 

y,i - 9, = (y, - y, )+(x- - % ) (io-56) 


donde y, es el promedio de las n, observaciones en x,. Al elevar al cuadrado ambos miembros de la ecua- 
ci6n 10-56 y hacer la operation suma sobre i y j se obtiene 


it, (y, - %y =2% +2 

1 1=1 i=l 1=1 1 


(10-57) 


El primer miembro de la ecuacidn 10-57 es la suma de cuadrados de los residuales ordinaria. Los dos 
componentes del segundo miembro miden el error puro y la falta de ajuste, Se observa que la suma de 
cuadrados del error puro 

ov -?.) 2 ( 10 - 58 ) 

/=i y-i 

se obtiene calculando la suma de cuadrados corregida de las observaciones repetidas en cada nivel de x y 
haciendo despues la agrupacidn en los m niveles de x. Si se satisface el supuesto de la varianza constante, 
6sta es una medida Independiente del modelo del error puro, ya que para calcular SS PE s61o se usa la varia- 
bilidad de lasy en cada nivel x*. Puesto que hay n t - 1 grados de libertad del error puro en cada nivel x t , el 
numero total de grados de libertad asociados con la suma de cuadrados del error puro es 

m 

2 (n-\)=n-m (10-59) 

1=1 


La suma de cuadrados de la falta de ajuste 


= 2 «.(?. - ?. ) 2 

i=l 


(10-60) 
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es una suma ponderada de los cuadrados de las desviaciones entre la respuesta media y, en cada nivel x, y 
el valor ajustado correspondiente. Si los valores ajustados y, est£n cerca de las respuestas promedioy, co- 
rrespondientes, entonces hay un fuerte indicio de que la funcion de regresidn es lineal. Si las y. se desvian 
mucho de lasy„ entonces es probable que la funcidn de regresion no sea lineal. Hay m-p grados de liber- 
tad asociados con SS LOF porque hay m niveles de x, y se pierden p grados de libertad porque deben esti- 
marse p pararaetros para el modelo. En lo que a los calculos se refiere, por lo general SS L0F se obtiene 
restando SS PE de SS E . 

El estadistico de prueba para la falta de ajuste es 


r = SS L0P l(m-p) _MS LOP 
0 SS PE /(n-m ) ” MS pe 


(10-61) 


El valor esperado de MS PE es o 2 , y el valor esperado de MS L0F es 


E(MS lop )=o 2 + 


m 

k. 

2 

E «• 

o-2 fa 


/-I 



m— 2 


(10-62) 


Si la verdadera funcion de regresidn es lineal, entonces E(y i )= +1. k j _ 1 f} j x ij , y el segundo termino de la 
ecuacidn 10-62 es cero, dando como resultado E(MS LOF ) = er 2 . Sin embargo, si la verdadera funcion de re- 
gresion no es lineal, entonces E(y i ) * f} 0 +2 k j=l ji J x ij y E(MS LOF ) > a 2 . Adem&s, si la verdadera funcion de 
regresion es lineal, entonces el estadistico F Q sigue la distribucidn Por lo tanto, para probar la falta 

de ajuste, se calcularia el estadistico de prueba F 0 y se concluiria que la funcion de regresion no es lineal si 

Fn > F 

M 0 a, m-p,n^m' 

Es sencillo incorporar este procedimiento de prueba en el an&lisis de varianza. Si se concluye que la 
funci6n de regresidn no es lineal, entonces el modelo tentativo habra de abandonarse y deberdn hacerse 
intentos para encontrar una ecuaci6n m^s apropiada. De manera alternativa, si F Q no excede F am ^ n ^ no 
existe evidencia solida de falta de ajuste y MS PE y MS L0F se combinan con frecuencia para estimar a 2 . El 
ejemplo 6-6 es una ilustracidn muy completa de este procedimiento, donde las replicas de las corridas son 
puntos centrales de un diseno factorial 2 2 . 


10-9 PROBLEMAS 

10-1. La resistencia a la tensi6n de un producto de papel se relaciona con la cantidad de madera dura en la pulpa, 
Se producen 10 muestras en la planta piloto y los datos obtenidos se presentan en la siguiente tabla. 


Resistencia 

Porcentaje de madera dura 

Resistencia 

Porcentaje de madera dura 

160 

10 

181 

20 

171 

15 

188 

25 

175 

15 

193 

25 

182 

20 

195 

28 

184 

20 

200 

30 


a) Ajustar un modelo de regresion lineal que relacione la resistencia con el porcentaje de madera dura. 

b) Probar el modelo del inciso a para la significacidn de la regresi6n. 

c) Encontrar un intervalo de confianza de 95% para el par&metro f! v 

10-2. En una planta se destila aire liquido para producir oxfgeno, nitrdgeno y argdn. Se piensa que el porcentaje de 
impurezas en el oxigeno se relaciona linealmente con la cantidad de impurezas en el aire, medida por el 
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“conteo de contaminacidn” en partes por mm6n (ppm). Una muestra de los datos de operation de la planta 
se presenta a continuacidn: 


Pureza (%) 

93.3 92.0 92.4 91.7 94.0 94.6 93.6 

Conteo de contaminacidn (ppm) 

1.10 1.45 1.36 1.59 1.08 0.75 1.20 


93.1 

93.2 

92.9 

92.2 

91.3 

90.1 

91.6 

91.9 

0.99 

0.83 

1.22 

1.47 

1.81 

2.03 

1.75 

1,68 


a) Ajustar un modelo de regresidn lineal a los datos. 

b) Probar la significacidn de la regresidn. 

c) Encontrar un intervalo de confianza de 95% para ff lm 

10-3. Graficar los residuales del problema 10-1 y comentar la adecuacidn del modelo. 

10-4. Graficar los residuales del problema 10-2 y comentar la adecuacidn del modelo. 

10-5. Utilizando los resultados del problema 10-1, probar el modelo de regresidn para la falta de ajuste. 
10-6. Se realizd un estudio sobre el desgastey de un cojinete y su relacidn con*! = viscosidad del aceite yx 2 = car- 
ga. Se obtuvieron los siguientes datos: 


y 


*2 

193 

1.6 

851 

230 

15.5 

816 

172 

22.0 

1058 

91 

43.0 

1201 

113 

33.0 

1357 

125 

40.0 

1115 


a) Ajustar un modelo de regresidn lineal multiple a los datos. 

b) Probar la significacidn de la regresidn. 

c) Calcular el estadistico t para cada par&metro del modelo. £Qud conclusiones pueden sacarse? 

10-7. Se piensa que la potencia al freno desarrollada por el motor de un automdvil en un dinamdmetro es una fun- 

cidn de la rapidez del motor en revoluciones por minuto (rpm), el octanaje del combustible y la compresidn 
del motor. Se llevd a cabo un experimento en el laboratorio y los datos colectados fueron: 


Potencia al freno 


225 

212 

229 
222 
219 
278 
246 
237 
233 
224 
223 

230 


rpni Octanaje 


2000 

90 

1800 

94 

2400 

88 

1900 

91 

1600 

86 

2500 

96 

3000 

94 

3200 

90 

2800 

88 

3400 

86 

1800 

90 

2500 

89 


Compresidn 

~ 100 

95 
110 

96 
100 
110 

98 

100 

105 

97 
100 
104 
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a) Ajustar un modelo de regresidn multiple a estos datos. 

b) Probar la significacidn de la regresion. lQu€ conclusiones pueden sacarse? 

c) Con base en las pruebas t, 6son necesarios los tres regresores en el modelo? 

10-8. Analizar los residuales del modelo de regresion del problema 10-7. Comentar la adecuacidn del modelo. 

10-9. El rendimiento de un proceso quimico se relaciona con la concent racion del reactivo y la temperatura de 
operacidn. Se realiza un experimento con los siguientes resultados: 


Rendimiento 

Concentracion 

Temperatura 

81 

1.00 

150 

89 

1.00 

180 

83 

2.00 

150 

91 

2.00 

180 

79 

1.00 

150 

87 

1.00 

180 

84 

2.00 

150 

90 

2.00 

180 


a) Suponga que quiere ajustarse un modelo de los efectos principales a estos datos. Establecer la matriz 
X'X utilizando los datos exactamente como aparecen en la tabla. 

b) £La matriz que se obtuvo en el inciso a es diagonal? Comentar la respuesta. 

c) Suponga que el modelo se escribe en tdrminos de las variables codificadas “usuales” 

Concentracidn -1.5 Temperatura - 165 

0.5 15 

Establecer la matriz X'X para el modelo en terminos de estas variables codificadas. (.Esta matriz es dia- 
gonal? Comentar la respuesta. 

d) Definir un nuevo conjunto de variables codificadas 

Concentracidn -1.0 _ Tempe ratura - 150 

* 1-_ To~ ' * 2 30 


Establecer la matriz X'X para el modelo en terminos de este conjunto de variables codificadas. £Esta 
matriz es diagonal? Comentar la respuesta. 

e) Resumir lo que se haya aprendido acerca de la codificacidn de variables con este problema. 

1040. Considere el experimento factorial 2 4 del ejemplo 6-2. Suponga que falta la ultima observacidn. Volver a ana- 
lizar los datos y sacar conclusiones. LC6mo se comparan estas conclusiones con las del ejemplo original? 

1041. Considere el experimento factorial 2 4 del ejemplo 6-2. Suponga que faltan las dos ultimas observaciones. 
Volver a analizar los datos y sacar conclusiones. £Cu£l es el resultado de la comparacidn de estas conclusio- 
nes con las del ejemplo original? 

10-12. Dados los datos siguientes, ajustar el modelo de regresidn polinomial de segundo orden 


Pa +p 1 x 1 +p 2 x 2 +p n xl +p n xl +Pn x i x 2 + £ 
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y 

*i 

*2 

26 

1.0 

1.0 

24 

1.0 

1.0 

175 

1.5 

4,0 

160 

1.5 

4.0 

163 

1.5 

4,0 

55 

0.5 

2.0 

62 

1.5 

2.0 

100 

0.5 

3.0 

26 

1.0 

1.5 

30 

0.5 

1.5 

70 

1.0 

2.5 

71 

1.5 

2.5 


Despuds de que se haya ajustado el modelo, probar la signification de la regresion. 

10-13, a) Considere el modelo de regresion cuadratico del problema 10-12. Calcular los estadisticos t de cada uno 
de los parametros del modelo y comentar las conclusiones a que se llega a partir de estas cantidades. 
b) Usar el metodo de la suma de cuadrados extra para evaluar el valor de los tdrminos cuadrdticos xf, x] y 
xpr 2 del modelo. 

10- 14. Relacidn entre el andlisis de varianza y el andlisis de regresidn. Cualquier modelo del an&lisis de vari anza puede 
expresarse en t6rminos del modelo lineal general y = xfi + e, donde la matriz X se compone de ccros y unos. 
Demostrar que el modelo con un solo factor y,y = pi + r, + £-, i — 1, 2, 3 J = 1, 2, 3, 4 puede escribirse en la for- 
ma del modelo lineal general. Despuds 

a) Escribir las ecuaciones normales (XX)0 - Xy y compararlas con las ecuaciones normales que se cncon- 
traron en el capitulo 3 para este modelo. 

b) Encontrar el rango de X'X. LEs posible obtener (X'X)- 1 ? 

c) Suponga que se elimina la primera ecuacion normal y se agrega la restriccion 2? =1 nx i = 0. 6Tiene solu- 
tion el sistema de ecuaciones resultante? De ser asf, encontrarla. Hallar la suma de cuadrados de regre- 
sion /JXy y compararla con la suma de cuadrados de los tratamientos del modelo con un solo factor. 

10-15, Suponga que se est£ haciendo el ajuste de una linea recta y se desea hacer la varianza de tan pequena como 
sea posible. A1 trabajar con la restriccion de un numero par de puntos experimentales, iddnde deberdn colo- 
carse estos puntos para minimizar K(^)? (Nota: usar el diseno que se pide en este ejercicio con sumo cuida- 
do, ya que, aun cuando minimiza tiene propiedades indeseables; ver, por ejemplo, Myers y 

Montgomery [85a]. Unicamente si se tiene una gran seguridad de que la verdadera relacidn funcional es li- 
neal deber£ considerarse el uso de este diseno.) 

10-16. Minimos cuadrados ponder ados. Suponga que se estd ajustando la lmea rectay = + e, pero la varianza 

de las y depende ahora del nivel de x; es decir, 

2 

v (y 1^/ ) = cr? i = 1,2,..., n 

donde las tv ; son constantes desconocidas, llamadas con frecuencia ponderaciones. Demostrar que si se eli- 
gen las estimaciones de los coeficientes de regresidn para minimizar la suma de cuadrados de los errores 

n 

ponderados dada por 2 w i (y i - /J 0 - p,x ( ) 2 , las ecuaciones normales de minimos cuadrados resultantes son 

n n n 

h'Z "i+p X w i x < = 2 

f = l /=1 i— 1 

00 2 "W+&2 w i x f = 2 w t x,y, 

i = 1 /=1 i=l 
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10-17* Considere el diseno analizado en el ejemplo 10-5. 

a) Suponga que se opta por aumentar el disefio con la corrida unica seleccionada en ese ejemplo. Encontrar 
las varianzas y las covarianzas de los coeficientes de regresidn del modelo (ignorando los bloques): 

y~ P 0 + fil X 2 + 

~*~Pl2 X l X 2 ^ ^3A X 3 X A 

b ) iHay otras corridas de la fraccidn alterna que separarian los alias AB de CD? 

c) Suponga que el diseno se aumenta con las cuatro corridas sugeridas en el ejemplo 10-5. Encontrar las va- 
rianzas y las covarianzas de los coeficientes de regresidn (ignorando los bloques) para el modelo del 
inciso a. 

d) Considerando los incisos aye, Lqu6 estrategia de aumento se preferiria y por que? 

10-18. Considere un diseno l\ u \ Suponga que despu6s de correr el experimento, los efectos observados m£s gran- 
des son ^4 + BD , B + AD y D + AB. Quiere aumentarse el diseno original con un grupo de cuatro corridas 
para separar los alias de estos efectos, 

a) iCu&les son las cuatro corridas que se harian? 

b) Encontrar las varianzas y las covarianzas de los coeficientes de regresidn del modelo 

y— /? 0 + fi\ X \ ^~02 X 2 + Pl2 X l X 2 + fiu X l X 4 

c ) 6Es posible separar los alias de estos efectos con menos de cuatro corridas adicionales? 




Metodos de superficies 
de respuesta y otros 
enfoques para la 
optimization de 
procesos 


1 M INTRODUCCI6N A LA METODOLOGIA DE SUPERFICIES DE RESPUESTA 

La metodologia de superficies de respuesta, o MSR, es una coleccion de tecnicas matematicas y estadisti- 
cas utiles en el modelado y el an£lisis de problemas en los que una respuesta de interbs recibe la infiuencia 
de diversas variables y donde el objetivo es optimizar esta respuesta. Por ejemplo, suponga que un inge- 
niero quunico quiere encontrar los niveles de temperatura fo) y presibn (x 2 ) que maximicen el rendimien- 
to (y) de un proceso. El rendimiento del proceso es una funcion de los niveles de la temperatura y la 
presibn, por ejemplo, 

y=f( x i> *j)+ c 

donde e representa el ruido o error observado en la respuesta y. Si la respuesta esperada se denota por 
E(y) = f(x u x 2 ) = 7/, entonces a la superficie representada por 

t]=f(x v x 2 ) 

se le llama superficie de respuesta. 

Por lo general la superficie de respuesta se representa gr&ficamente como en la figura 11-1, donde rj 
se grafica contra los niveles dex, yx 2 . Se han visto ya graficas de superficie de respuesta como bsta, parti- 
cularmente en los capitulos sobre disenos factoriales. Para ayudar a visualizar la forma de una superficie 
de respuesta, con frecuencia se grafican los contornos de la superficie de respuesta, como se muestra en 
la figura 11-2. En la grbfica de contomo se trazan las lfneas de respuesta constante en el piano x 2 ,x 2 . Cada 
contorno corresponde a una altura particular de la superficie de respuesta. Tambicn se ha visto antes 
la utilidad de las graficas de contomo. 

En la mayoria de los problemas MSR, la forma de la relacibn entre la respuesta y las variables inde- 
pendientes es desconocida. Por lo tanto, el primer paso de la MSR es encontrar una aproximacibn ade- 
cuada de la verdadera relacibn funcional entre y y el conjunto de variables independientes. Por lo general 
se emplea un polinomio de orden inferior en alguna regibn de las variables independientes. Si la respues- 
ta esta bien modelada por una fundbn lineal de las variables independientes, entonces la funcibn de apro- 
ximacibn es el modelo de primer orden 

y=P o + Pi x i+P2X2 + -+P k x k +e ( 11 - 1 ) 


427 
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Figura li-1 Superficie de respuesta tridimensional donde se indica el rendi- 
miento esperado (rj) como una funcidn de la temperatura (xj y la presidn (xj. 
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Figura 11-2 Grafica de contorno de una superficie de respuesta. 
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Si hay curvatura en el sistema, entonces debe usarse un polinomio de orden superior, tal como el modelo 
de segundo orden 

y= Po +s Pi*, +E +SX Pf*i x t +£ ( n ' 2 ) 

1=1 1=1 i<j 

En casi todos los problemas MSR se usa uno de estos modelos, o ambos. Desde luego, es probable que un mo- 
delo polinomial sea una aproximacidn razonable de la verdadera relacidn funcional en el espacio completo de 
las variables independientes, pero para una regidn relativamente pequena suelen funcionar bastante bien. 

El mdtodo de minimos cuadrados, estudiado en el capitulo 10, se usa para estimar los parametros de 
los polinomios de aproximacidn. Despuds se realiza el an&lisis de la superficie de respuesta utilizando la 
superficie ajustada. Si la superficie ajustada es una aproximacidn adecuada de la verdadera funcidn de la 
respuesta, entonces el analisis de la superficie ajustada ser& un equivalente aproximado del an&lisis del 
sistema real Los parametros del modelo pueden estimarse de manera m&s eficiente cuando se emplean 
los disenos experimentales apropiados para recolectar los datos. Los disenos para ajustar superficies de 
respuesta se denominan disenos de superficie de respuesta. Estos disenos se revisan en la seccidn 11-4. 

La MSR es un procedimiento secuencial. Muchas veces, cuando se est£ en un punto de la superficie 
de respuesta que esta apartado del dptimo, como en el caso de las condiciones de operacidn actuates de la 
figura 11-3, el sistema presenta una curvatura moderada y el modelo de primer orden sera apropiado. El 
objetivo en este caso es llevar al experimentador de manera rapiday eficiente por la trayectoria del mejo- 
ramiento hasta la vecindad general del optimo. Una vez que se ha encontrado la regidn del dptimo, puede 
emplearse un modelo m&s elaborado, como el de segundo orden, y llevarse a cabo un an&lisis para locali- 
zar el dptimo. En la figura 11-3 se puede ver que el an&lisis de una superficie de respuesta puede conside- 
rate como “el ascenso a una colina”, donde la cima de esta represent a el punto de la respuesta m&xima. 
Si el verdadero dptimo es un punto de respuesta minima, entonces la situacidn puede considerarse como 
u el descenso a un valle”. 

El objetivo ultimo de la MSR es determinar las condiciones de operacidn dptimas del sistema o de- 
terminar una region del espacio de los factores en la que se satisfagan los requerimientos de operacidn. 



Figura 11-3 El carftcter secuencial de la MSR. 
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Analisis m£s detallados de la MSR se encuentran en Myers y Montgomery [85a], Khuri y Cornell [67] y 
Box y Draper [16b]. 


1 1*2 METODO DEL ASCENSO MAS PRONUNCIADO 

Frecuentemente la estimaci6n inicial de las condiciones de operation optimas del sistema estar&n lejos 
del optimo real. En tales circunstancias, el objetivo del experimentador es pasar con rapidez a la vecindad 
general del dptimo. Para ello desea usarse un procedimiento experimental econdmico y eficiente. Cuan* 
do se est4 muy lejos del dptimo, por lo general se supone que un modelo de primer orden es una aproxi- 
macidn adecuada de la verdadera superficie en una region pequena de las x. 

El metodo del ascenso mas pronunciado es un procedimiento para moverse secuencialmente sobre la 
trayectoria del ascenso mds pronunciado, es decir, en la direccidn del incremento maximo de la respuesta. 
Desde luego, si lo que se pretende es una minimizacidn, entonces esta tdcnica se llama metodo del descen- 
so mas pronunciado. El modelo ajustado de primer orden es 

k 

(H-3) 

1=1 

y la superficie de respuesta de primer orden, es decir, los contornos de >>, es una serie de lineas paralelas 
como las que se muestran en la figura 11-4. La direccidn del ascenso m£s pronunciado es aquella en la que 
9 se incrementa con mayor rapidez. Esta direccidn es paralela a la normal de la superficie de respuesta 
ajustada. Por lo general se toma como la trayectoria del ascenso m£s pronunciado a la recta que pasa por 
el centra de la regidn de interds y que es normal a la superficie ajustada. Por lo tanto, los pasos sobre la 



Figura 11-4 Superficie de respuesta de primer orden y trayecto- 
ria del ascenso m&s pronunciado. 
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trayectoria son proportionates a los coeficientes de regreskm {ft}. El tamano real del paso lo determina 
el experimentador con base en el conotimiento del proceso o de otras considerations practicas, 

Se conducen experimentos sobre la trayectoria del ascenso m£s pronunciado hasta que deja de obser- 
varse un incremento adicional en la respuesta. Entonces puede ajustarse un nuevo modelo de primer or- 
den, determinate una nueva trayectoria del ascenso m£s pronunciado y el procedimiento continua. En 
ultima instancia, el experimentador llegar& a la vecindad del 6ptimo. En general, la falta de ajuste del mo- 
delo de primer orden indica que se ha llegado a ella. En este momento se realizan experimentos adiciona- 
les para obtener una estimacidn m£s precisa del 6ptimo. 

EJEMPLOIM - 

Un ingeniero quimico est& interesado en determinar las conditions de operacidn que maximizan el ren- 
dimiento de un proceso. Dos variables controlables influyen en el rendimiento del proceso: el tiempo de 
reaccidn y la temperatura de reaccidn. El ingeniero opera actualmente el proceso con un tiempo de reac- 
cidn de 35 minutos y una temperatura de 155°F, que dan como resultado rendimientos de cerca de 40%. 
Puesto que es improbable que esta regidn contenga el dptimo, el ingeniero ajusta un modelo de primer 
orden y aplica el mdtodo del ascenso m&s pronunciado. 

El ingeniero decide que la regidn de exploracidn para ajustar el modelo de primer orden deberi ser 
(30, 40) minutos de tiempo de reaccidn y (150, 160)°E Para simplificar los cSlculos, las variables indepen- 
dientes se codificar&n en el intervalo usual (-1, 1). Por lo tanto, si denota la variable natural tiempo y £ 2 
la variable natural temperatura, entonces las variables codificadas son 

^-35 £ 2 -155 

^ = y 

El diseno experimental se muestra en la tabla 11-1. Observe que el diseho usado para recabar estos datos 
es un factorial 2 2 aumentado con cinco puntos centrales. Las replicas del centro se usan para estimar el 
error experimental y permitir la verificacidn de la adecuacidn del modelo de primer orden. Adem&s, el di- 
seno est& centrado airededor de las condiciones de operacidn actuales del proceso. 

Es posible ajustar un modelo de primer orden a estos datos por el procedimiento de mfnimos cuadra- 
dos. Aplicando los mdtodos para disenos de dos niveles se obtiene el siguiente modelo en las variables co- 
dificadas: 

£= 40.44 + 0. 775*, + 0.325* 2 


labia 11-1 Datos del proceso para aj ustar el modelo de 
primer orden 


Variables 

naturales 


ii |2_ 

30 150 

30 160 

40 150 

40 160 

35 155 

35 155 

35 155 

35 155 

35 155 


Variables 

codificadas 


il *2_ 

-1 -1 

~1 1 

1 -1 

1 1 

0 0 

0 0 

0 0 

0 0 

0 0 


Respuesta 

y 

39.3 
40.0 
40,9 

41.5 

40.3 

40.5 
40.7 
40.2 

40.6 
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Antes de explorer a lo largo de la trayectoria del ascenso mas pronunciado, debera investigarse la 
adecuacidn del modelo de primer orden. El diseno 2 2 con puntos centrales permite al experimentador 

1. Obtener una estimacidn del error. 

2. Verificar las interacciones (o terminos de productos cruzados) del modelo. 

3. Verificar los efectos cuadraticos (curvatura). 

Las replicas del centro pueden usarse para calcular una estimacidn del error de la siguiente manera: 

, (40.3) 2 +(40.5) 2 +(40.7) 2 +(40.2) 2 +(40.6) 2 - (202.3) 2 / 5 

d = 4 

= 0.0430 

En el modelo de primer orden se supone que las variables*! yx 2 tienen un efecto aditivo sobre la respues- 
ta. La interaccidn entre las variables se representaria por el coeficiente del termino de un producto 
cruzado x^x> sumado al modelo. La estimaci6n de minimos cuadrados de este coeficiente es simplemente 
la mitad del efecto de la interaction que se calcula como en un diseno factorial 2 2 ordinario, o 

h =i[(lx39.3)+(lx41.5)+(-lx40.0)+(-lx40.9)] 

= i(-o.i) 

= -0.025 

La suma de cuadrados de la interacci6n con un solo grado de libertad es 

(- 0 . 1) 2 

cc = i 

Interacci6n ^ 

= 0.0025 

Al comparar 55 lnteracci6n con d 2 se obtiene el estadistico para la falta de ajuste 

cc 

r? ^ u lntcrflcci6n 

_ 0.0025 
= 0.0430 
* 0.058 

que es pequeno, lo cual indica que la interaccidn es insignificante. 

Otra verification de la adecuacidn del modelo de linea recta se obtiene aplicando la verification del 
efecto de curvatura cuadr&tica pure de la seccidn 6-6. Recuerde que esta consiste en comparar la respues- 
ta promedio en los cuatro puntos de la porcidn factorial del diseno, por ejeinplo y ; , = 40.425, con la res- 
puesta promedio en el centro del diseno, por ejemplo y c = 40.46. Si existe curvatura cuadrtitica en la 
verdadera funcidn de la respuesta, entoncesy f -y c es una medida de esta curvatura. Si/3 n y /3 22 son los coe- 
ficientes de los tdrminos “cuadraticos puros” * 2 y x\ , entoncesy f -y c es una estimacion de + p Z2 - En el 
ejemplo tratado aquf, una estimacidn del t6rmino cuadratico puro es 

h + K = yr-yc 

= 40.425- 40.46 
= -0.035 
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Tabla 11-2 AnSligis de varianza del modelo de primer orden 


Fuente de variacidn 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

F o 

Valor P 

Modelo fi 2 ) 

2,8250 

2 

1.4125 

47.83 

0.0002 

Residual 

0.1772 

6 




(Interaccidn) 

(0.0025) 

1 

0.0025 

0.058 

0.8215 

(Cuadrltico puro) 

(0.0027) 

1 

0.0027 

0.063 

0.8142 

(Error puro) 

(0.1720) 

4 

0.0430 



Tbtal 

3.0022 

8 





La suma de cuadrados con un solo grado de libertad asociada con la hipdtesis nula, H 0 :j } u + /3 22 = 0, es 

n F n cOF-y c f 


SS, 


Cuadratica pura 


n F +n c 


. (4)(5)(-0.035) 2 
4+5 

= 0.0027 


donde n F y n c son el numero de puntos de la porcion factorial y el numero de puntos centrales, respectiva- 
mente. Puesto que 


F = 


SS, 


Cuadratica pura 


a 1 


0.0027 

0.0430 


= 0.063 


es pequeno, no hay indicios de un efecto cuadr&tico puro. 

En la tabla 11-2 se resume el analisis de varianza de este modelo. Las verificaciones de la interaccidn 
y la curvatura no son significativas, mientras que la prueba F de la regresion global es significativa. Ade- 
nitis, el error estandar de ^ y es 


|MI_ E_ f 

se ( pi) ~i 4 4 "V 


0.0430 


= 0.10 


i = 1 , 2 


Ambos coeficientes de regresidn y /3 2 son grandes en comparacidn con sus errores estandar. En este 

punto no hay razdn para cuestionar la adecuacidn del modelo de primer orden. 

Para apartarse del centro del diseno — el punto (jq = 0,x 2 = 0) — sobre la trayectoria del ascenso mas 
pronunciado, se haria un movimiento de 0.775 unidades en la direccidnjq por cada 0.325 unidades en la 
direcci6nx 2 . Por lo tanto, la trayectoria del ascenso mfis pronunciado pasa por el punto (jq = 0, x 2 = 0) y 
tiene pendiente 0.325/0.775. El ingeniero decide usar 5 minutos de tiempo de reaccidn como tamano basi- 
co del paso. A1 utilizar la relacidn entre iq yx lt se observa que 5 minutos de tiempo de reaccion es equiva- 
lente a un paso en la variable codificada jq de Aq = 1. Por lo tanto, los pasos sobre la trayectoria del 
ascenso mas pronunciado son Aq = 1.0000 y Ax 2 = (0.325/0.775) Axj = 0.42. 

El ingeniero calcula puntos sobre esta trayectoria y observa los rendimientos en los mismos hasta que 
se nota un decremento en la respuesta. En la tabla 11-3 se muestran los resultados tanto en variables codi- 
ficadas como naturales. Aun cuando la manipulacion matematica de las variables codificadas es m£s sen- 
cilla, deben usarse las variables naturales cuando se corre el proceso. En la figura 11-5 se grafica el 
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Tabla 11-3 Experimento del ascenso m5s pronunciado para el ejemplo 11-1 


Pasos 

Variables codificadas 

*1 *2 

Variables naturales 

£i £2 

Respuesta 

y 

Origen 

0 

0 

35 

155 


A 

1.00 

0.42 

5 

2 


Origen + A 

1.00 

0.42 

40 

157 

41.0 

Origen + 2A 

2.00 

0.84 

45 

159 

42.9 

Origen + 3A 

3.00 

1.26 

50 

161 

47.1 

Origen + 4A 

4.00 

1.68 

55 

163 

49.7 

Origen + 5A 

5.00 

2.10 

60 

165 

53.8 

Origen + 6A 

6.00 

2.52 

65 

167 

59.9 

Origen + 7A 

7.00 

2.94 

70 

169 

65.0 

Origen + 8A 

8.00 

3.36 

75 

171 

70.4 

Origen + 9A 

9.00 

3.78 

80 

173 

77.6 

Origen + 10A 

10.00 

4.20 

85 

175 

80.3 

Origen + 11A 

11.00 

4.62 

90 

179 

76.2 

Origen + 12A 

12.00 

5.04 

95 

181 

75.1 


rendimiento en cada paso de la trayectoria del ascenso mds pronunciado. Se observan incrementos de la 
respuesta hasta el decimo paso; sin embargo, todos los pasos despu6s de este punto resultan en un decre- 
mento del rendimiento. Por lo tanto, debera ajustarse otro modelo de primer orden en la vecindad gene- 
ral del punto (£ t = 85, £ 2 = 175). 

Se ajusta un nuevo modelo de primer orden alrededor del punto (£j = 85, | 2 = 175). La region de ex- 
ploracidn para es [80, 90] y para § 2 es [170, 180], Por lo tanto, las variables codificadas son 


x , =■ 


Si “85 


^,-175 



Figura 11-5 Rendimiento contra pasos sobre la trayectoria 
del ascenso mis pronunciado para el ejemplo 11-1. 
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Tabla 11-4 Datos para el segundo modelo de primer 
orden 


Variables 

naturales 

Variables 

codificadas 

Respuesta 

y 

i, 

i 2 

*1 

*2 

80 

170 

-1 

-1 

76.5 

80 

180 

-1 

1 

77.0 

90 

170 

1 

-1 

78.0 

90 

180 

1 

1 

79.5 

85 

175 

0 

0 

79.9 

85 

175 

0 

0 

80.3 

85 

175 

0 

0 

80.0 

85 

175 

0 

0 

79.7 

85 

175 

0 

0 

79.8 


De nueva cuenta se usa un diseno 2 2 con cinco puntos centrales. El diseno experimental se muestra en la 
tabla 11-4. 

El ajuste del modelo de primer orden a las variables codificadas de la tabla 11-4 es 

y= 78.97+ LOOx, + 0.50x 2 

En la tabla 11-5 se presenta el andlisis de varianza de este modelo, incluyendo las verificaciones de la 
interaccidn y del tdrmino cuadratico puro. Las verificaciones de la interaction y del termino cuadrdtico 
puro implican que el modelo de primer orden no es una aproximacidn adecuada. Esta curvatura en la ver- 
dadera superficie puede indicar que el experimentador se encuentra cerca del 6ptimo. En este punto es 
necesario hacer analisis adicionales para localizar el dptimo con mayor precision. 


Por el ejemplo 11-1 se observa que la trayectoria del ascenso mas pronunciado es proporcional a los sig- 
nos y magnitudes de los coeficientes de regresidn del modelo ajustado de primer orden 

y=K+i M 

j=i 

Es sencillo dar un algoritmo general para determinar las coordenadas de un punto sobre la trayectoria del 
ascenso mSs pronunciado. Suponga que el punto x, = x 2 = . . . = x k = 0 es la base o punto origen. Entonces 

1. Se elige el tamaiio del paso en una de las variables del proceso, por ejemplo At). En general, se se- 
leccionarfa la variable de la que se tenga mayor information, o se seleccionarfa la variable que 
tiene el coeficiente de regresion absoluto |/T | mas grande. 

Tabla 11-5 AnSlisis de varianza del segundo modelo de primer orden 


Suma de Grados de Cuadrado 


Fuente de variacidn 

cuadrados 

libertad 

medio 

F 0 Valor P 

Regresidn 

5.00 

2 



Residual 

11,1200 

6 



(Interaccidn) 

(0.2500) 

1 

0.2500 

4.72 0.0955 

(Cuadratico puro) 

(10.6580) 

1 

10.6580 

201.09 0.0001 

(Error puro) 

(0,2120) 

4 

0.0530 


Tbtal 

16.1200 

8 
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2. El tamaiio del paso de las otras variables es 

Pi 


Ax. = — 


' Pj / Akj 


i = l,2,..., k; i*j 


3. Se convierten las de variables codificadas a variables naturales. 


Para ilustrar, considere la trayectoria del ascenso mas pronunciado calculada en el ejemplo 11-1. 
Puesto quex t tiene el coeficiente de regresiOn mas grande, se selecciona el tiempo de reaccion como la va- 
riable del paso 1 del procedimiento anterior. Cinco minutos de tiempo de reaccion es el tamaiio del paso 
(con base en el conocimiento del proceso). En terminus de las variables codificadas, este es = 1.0. Por 
lo tanto, por el lineamiento 2, el tamaiio del paso de la temperatura es 


Ax 2 


Jl ^_- 0.42 

/3,/it, (0.775/1.0) 


Para convertir los tamanos de los pasos codificados (Axj = 1.0 y \x 2 = 0.42) a las unidades naturales de 
tiempo y temperatura, se usan las relaciones 


A*i = 




Ax 2 = 


A£ : 


que dan como resultado 


A£j = Ajc t (5) = 1.0(5) = 5 min 


y 


A£ 2 = A* 2 (5)= 0.42(5)= 2°F 
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Cuando el experimentador se encuentra relativamente cerca del Optimo, por lo general se requiere un 
modelo que incorpore la curvatura para aproximar la respuesta. En la mayoria de los casos, el modelo de 
segundo orden 

/>,*,+£ < u - 4 > 

i=l i=l i<j 

es adecuado. En esta seccidn se indicara c6mo usar este modelo ajustado para encontrar el conjunto opti- 
mo de condiciones de operacidn para las x, asi como para caracterizax la naturaleza de la superficie de res- 
puesta. 


11-3.1 Ix>calizaci6n del punto estacionario 

Suponga que quieren encontrarse los niveles &ex 1 ,x 2 , .:,x k que optimizan la respuesta predicha. Este pun- 
to, en caso de existir, sera el conjunto de las x l9 x 2 , x k para las que las derivadas parcialesdy/ dx x = 
dy/ dx 2 = ■ ■ ■ = $/ dx k = 0. A este punto, por ejemplo x l s ,x 2 s> se le llama punto estacionario. El pun- 

to estacionario podrfa representar 1) un punto de respuesta maxima, 2) un punto de respuesta minima, o 
3) un punto silla. Estas tres posibilidades se ilustran en las figuras 11-6 a 11-8. 

Las graficas de contorno desempenan un papel muy importante en el estudio de las superficies de 
respuesta. Mediante la generation de gr&ficas de contorno utilizando software de computadora para el 
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6) Grtfica de contorno 


Figura 11-6 Superficie de respuesta y grdfica de contorno que ilustran una superficie con un m&ximo. 
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analisis de superficie de respuesta, el experimentador puede por lo general caracterizar la forma de la su- 
perficie y localizar el dptimo con una precisidn razonable. 

Es posible obtener una solucidn matematica general para la localization del punto estacionario. A1 
escribir el modelo de segundo orden en notation matricial, se tiene 

y = +x'b + x'Bx (11-5) 

donde o 


V 

*2 

b = 

'K 

h 

y B = 

■■ 

•. A/ 2 
A/2 



A. 


simetrica 

1 


Es decir, b es un vector (k x 1) de los coeficientes de regresion de primer orden y B es una matriz sime- 
trica ( k x k) cuyos elementos de la diagonal principal son los coeficientes cuadraticospnrrw (fi s )y cu- 
yos elementos que est&n fuera de la diagonal son la mitad de los coeficientes cuadraticos mixtos 
(fi.., i yt ;•). La derivada de y con respecto a los elementos del vector x igualada con 0 es 

— = b+2Bx=0 (11-6) 

dx 

El punto estacionario es la solucidn de la ecuacidn 11-6, o 

x s = B _1 b (11-7) 

Ademds, al sustituir la ecuacidn 11-7 en la 11-5, la respuesta predicha en el punto estacionario puede en- 
contrarse como 

y 6 =^o + i x > ( 11_8 ) 


1 1-3.2 Caracterizacion de la superficie de respuesta 

Una vez que se ha encontrado el punto estacionario, generalmente es necesario caracterizar la superficie 
de respuesta en la vecindad inmediata de este punto. Por caracterizar se entiende determinar si el punto 
estacionario es el punto de una respuesta maxima, minima o un punto silla, Por lo general tambien se de- 
sea estudiar la sensibilidad relativa de la respuesta a las variables x lf x 2 , x k . 

Como ya se senald, la forma mas directa de hacer esto es examinando una gr&fica de contorno del 
modelo ajustado. Si sdlo hay dos o tres variables en el proceso (lasx), la construction e interpretation de 
esta grfifica de contorno es relativamente sencilla. Sin embargo, incluso cuando hay un numero relativa- 
mente reducido de variables, un analisis m&s formal, llamado analisis can6nico, puede ser util. 

Es conveniente transformar primero el modelo en un nuevo sistema de coordenadas con el origen en 
el punto estacionario x, y despu6s hacer la rotation de los ejes de este sistema hasta que sean paralelos a 
los ejes principales de la superficie de respuesta ajustada. Esta transformation se ilustra en la figura 11-9. 
Puede demostrarse que se obtiene asi el modelo ajustado 

5 > = + ^\ W l + ^2 W 2 + "• + ^k W k (11-9) 

donde las {w,} son las variables independientes transformadas y las {A,} son constantes. A la ecuacion 
11-9 se le llama la forma candnica del modelo. Ademds, las {A,} son sdlo eigenvalores o raices caracteris- 
ticas de la matriz B. 
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x 2 



Figura 11-9 Forma can6nica del modelo de segundo 
orden. 


La naturaleza de la superficie de respuesta puede determinarse a partir del punto estacionario y de 
los signos y magnitudes de las {A,}. Primero suponga que el punto estacionario estd dentro de la regidn de 
exploracidn para ajustar el modelo de segundo orden* Si todas las {A f } son positivas, x* es un punto de res- 
puesta minima; si todas las {AJ son negativas, es un punto de respuesta maxima; y si las {A f } tienen sig- 
nos diferentes, es un punto silla. Adem&s, la superficie presenta una inclinacidn mayor en la direccidn 
w t para la que | A, | es el maximo. Por ejemplo, la figura 11-9 describe un sistema para el que x* es un m&xi- 
mo (A : y A 2 son negativas) con IAJ > |A 2 |. 

EJEMPLO 11"2 

Se continuara el analisis del proceso quimico del ejemplo 11-1. No es posible ajustar un modelo de segun- 
do orden en las variables*! y x 2 utilizando el diseno de la tabla 11-4. El experimentador decide aumentar 
este diseno con puntos suficientes para ajustar un modelo de segundo orden. 1 Obtiene cuatro observatio- 
ns en^ = 0,x 2 = ± 1.414) y(x, = ± 1.414, x 2 = 0), El experimento completo se muestra en la tabla 11-6, y 
el diseno se ilustra en la figura 11-10. A este diseno se le llama diseno central compuesto (o DCC), el cual 
se estudiard con mayor detalle en la section 11-4.2* En esta segunda fase del estudio, dos respuestas adi- 
cionales fueron de interes, la viscosidad y el peso molecular del producto. Las respuestas tambien se 
muestran en la tabla 11-6. 

La atencion se centrara en el ajuste de un modelo cuadratico para la respuesta rendimiento y x (las 
otras respuestas se analizaran en la seccidn 11-3.4). Por lo general se utiliza software de computadora 
para ajustar una superficie de respuesta y construir las graficas de contorno. La tabla 1 1-7 contiene la sali- 
da de Design-Expert . A1 examinar la tabla se observa que este paquete de software calcula primero las “su- 
mas de cuadrados extra o secuenciales” de los t6rminos lineales, cuadrdticos y cubicos del modelo (hay un 
mensaje de advertencia referente a los alias del modelo cubico, ya que el DCC no contiene corridas sufi- 
cientes para apoyar un modelo cubico completo). Con base en el valor P pequeno de los t£rminos cuadr£- 


1 El ingeniero corri6 las cuatro observaciones adicionales aproximadamente en el mismo periodo en que corrid las nueve obseivacio- 
nes originales. Si hubiera transcurrido un lapso grande entre las dos series de corridas, habria sido necesaria la separacidn en bloques. 
La separacidn en bloques en los disenos de superficie de respuesta se revisa en la seccidn 114*3. 
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Tabla 11-6 Diseno central compuesto para el ejmplo 11-2 


Variables naturales 

St Si 

Variables codificadas 

*1 *2 

yi 

(rendimiento) 

Respuestas 

y 2 

(viscosidad) 

y 3 

(peso molecular) 

80 

170 

-1 

-1 

76*5 

62 

2940 

80 

180 

-1 

1 

77.0 

60 

3470 

90 

170 

1 

-1 

78.0 

66 

3680 

90 

180 

1 

1 

79.5 

59 

3890 

85 

175 

0 

0 

79.9 

72 

3480 

85 

175 

0 

0 

80.3 

69 

3200 

85 

175 

0 

0 

80.0 

68 

3410 

85 

175 

0 

0 

79,7 

70 

3290 

85 

175 

0 

0 

79.8 

71 

3500 

92.07 

175 

1.414 

0 

78.4 

68 

3360 

77.93 

175 

-1.414 

0 

75.6 

71 

3020 

85 

182*07 

0 

1.414 

78.5 

58 

3630 

85 

167*93 

0 

-1*414 

77.0 

57 

3150 


ticos ? se decide ajustar un modelo de segundo orden a la respuesta rendimiento* La salida de 
computadora muestra el modelo final en terminos tanto de las variables codificadas como de los niveles 
naturales o reales de los factores. 

En la figura 11-11 se muestra la gr&fica de la superficie de respuesta tridimensional y la grafica de 
contorno para la respuesta rendimiento en terminos de las variables del proceso tiempo y temperatura. 
Es relativamente sencillo ver por el examen de estas figuras que el dptimo se encuentra muy cerca de 
175°F y 85 minutos de tiempo de reaccidn y que la respuesta est£ en un m£ximo en este punto. Por el exa- 
men de la grafica de contorno se observa que el proceso puede ser ligeramente m&s sensible a los cambios 
en el tiempo de reaccidn que a los cambios en la temperatura* 


*2 



Figura 11-10 Diseno central compuesto para el ejemplo 11-2. 
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Tabla 11-7 Salida de computadora de Design-Expen para ajustar un modelo a la respuesta 


rendimiento del ejemplo 11-2 


Response: 

yield 






***WARNING: The Cubic Model is 

Aliased!*** 




Sequential Model Sum of Squares 






Sum of 


Mean 

F 



Source 

Squares 

DF 

Square 

Value 

Prob > F 


Mean 

80062.16 

1 

80062.16 




Linear 

10.04 

2 

5.02 

2.69 

0.1166 


2FI 

0.25 

1 

0.25 

0.12 

0.7350 


Quadratic 

17.95 

2 

8,98 

126,88 

<0.0001 

Suggested 

Cubic 

2.042E-003 

2 

1.02 IE-003 

0.010 

0.9897 

Aliased 

Residual 

0.49 

5 

0.099 




Total 

80090.90 

13 

6160.84 





"Suma de cuadrados del modelo secuenciaf ' : se selecciona el polinomio de orden m£s alto 
cuando los t6rminos adicionales son signrficativos. 


Lack of Fit Tests 


Source 

Sum of 
Squares 

DF 

Mean 

Square 

F 

Value 

Prob > F 


Linear 

18.49 

6 

3.08 

58.14 

0.0008 


2FI 

18.24 

5 

3.65 

68.82 

0.0006 


Quadratic 

0.28 

3 

0.094 

1.78 

0.2897 

Suggested 

Cubic 

0.28 

1 

0.28 

5.31 

0.0826 

Aliased 

Pure Error 

0.21 

4 

0.053 





"Pruebas de falta de ajuste " : se quiere que el modelo seleccionado no tenga fate de ajuste 
significativa. 


Model Summary Statistics 



Std. 


Adjusted 

Predicted 



Source 

Dev, 

R-Squared 

R-Squared 

R-Squared 

PRESS 


Linear 

1.37 

0.3494 

0.2193 

—0.0435 

29.99 


2FI 

1.43 

0.3581 

0.1441 

-0.2730 

36.59 


Quadratic 

0.27 

0.9828 

0.9705 

0.9184 

2.35 

Suggested 

Cubic 

0.31 

0.9828 

0.9588 

0.3622 

18.33 

Aliased 


"Estadlsticos de resumen del modelo' 1 : se enfocan en ei modelo que minimiza TRESS'* o, de 
manera equivalents, que maximize la "R CUADRADA DE PREDICCION". 


Response: yield 

ANOVA for Response Surface Quadratic Model 


Analysis of variance table [Partial sum of squares] 



Sum of 


Mean 

F 


Source 

Squares 

DF 

Square 

Value 

Prob > F 

Model 

28.25 

5 

5.65 

79.85 

<0.0001 

A 

7,92 

1 

7.92 

111.93 

<0.0001 

B 

2.12 

1 

2.12 

30.01 

0.0009 

A 2 

13.18 

7 

13.18 

186.22 

<0.0001 

B 2 

6.97 

7 

6.97 

98,56 

<0.0001 

AB 

0.25 

7 

0.25 

3.53 

0.1022 

Residual 

0.50 

7 

0.071 



Lack of Fit 

0.28 

3 

0.094 

1.78 

0.2897 

Pure Error 

0.21 

4 

0.053 



Cor Total 

28.74 

12 




Std. Dev. 

0.27 


R-Squared 

0.9828 


Mean 

78.48 


Adj R-Squared 

0.9705 


C.V. 

0.34 


Pred R-Squared 

0.9184 


PRESS 

2.35 


Adeq Precision 

23,018 
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Tab la 11-7 (contmuacidn) 



Coefficient 


Standard 

95% Cl 

95% Cl 


Factor 

Estimate 

DF 

Error 

Low 

High 

VIF 

Intercept 

79.94 

1 

0.12 

79.66 

80,22 


A-time 

0.99 

1 

0.094 

0,77 

1.22 

LOO 

B-temp 

0.52 

1 

0.094 

0.29 

0.74 

LOO 

A 2 

-1.38 

1 

0.10 

-1.61 

-1.14 

L02 

B 2 

-1.00 

1 

0.10 

-1,24 

-0.76 

1.02 

AB 

0.25 

1 

0.13 

-0.064 

0.56 

LOO 


Final Equation in Terms of Coded Factors: 

yield = 

+79.94 
+0,99 * A 
+0,52 * B 
-1,38 * A 2 
-1.00 * B 2 
+0.25 * A * B 

Final Equation in Terms of Actual Factors: 

yield = 

-1430.52285 

+7.80749 * time 
+ 13.27053 * temp 
-0.055050 * time 2 
—0.040050 * temp 2 
+0.010000 * time * temp 


Diagnostics Case Statistics 


Run 

Standard 

Actual 

Predicted 



Student 

Cook's 

Outlier 

Order 

Order 

Value 

Value 

Residual 

Leverage 

Residual 

Distance 

t 

8 

1 

76.50 

76.30 

0.20 

0,625 

L213 

0.409 

1.264 

6 

2 

78.00 

77.79 

0.21 

0.625 

1.275 

0.462 

1.347 

9 

3 

77.00 

76.83 

0,17 

0.625 

1.027 

0.293 

1.032 

11 

4 

79,50 

79.32 

0.18 

0.625 

1.089 

0.329 

1.106 

12 

5 

75.60 

75.78 

-0.18 

0.625 

-L107 

0,341 

-1.129 

10 

6 

78.40 

78.59 

-0.19 

0.625 

-L195 

0,396 

-1.240 

7 

7 

77.00 

77.21 

-0,21 

0.625 

— 1.283 

0.457 

— 1 ,358 

1 

8 

78.50 

78.67 

-0.17 

0.625 

-L019 

0.289 

-1.023 

5 

9 

79.90 

79.94 

-0.040 

0.200 

-0.168 

0.001 

-0.156 

3 

10 

80,30 

79.94 

0.36 

0.200 

1,513 

0.095 

1.708 

13 

11 

80.00 

79.94 

0.060 

0,200 

0,252 

0.003 

0.235 

2 

12 

79.70 

79.94 

-0.24 

0.200 

-1,009 

0.042 

-LQ10 

4 

13 

79.80 

79.94 

-0.14 

0,200 

-0.588 

0.014 

-0,559 


La localizacidn del punto estacionario tambien podria encontrarse utilizando la solucidn general de 


la ecuacidn 11-7. Observe 



[-1.376 0.1250 

0.1250 -1.001 


y, por la ecuacion 11-7, el punto estacionario e$ 




[—0.7345 

-0.09171 

[0.9951 


[0.3891 

-0.0917 

-1.0096 

0.515 


0.306 
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a) La gr&fica de contorno 



b) La grAflca de superficie de respuesta 

Figura 11-11 Grlficas de contorno y de superficie de respuesta de 
la respuesta rendimiento, ejemplo 11-2. 


Es decir,jc ls = 0.389 yx 2 . s 


0.306. En terminos de las variables naturales, el punto estacionario es 


0.389 = 


0.306 = 


1 2 —175 
5 


de donde se obtiene = 86.95 - 87 minutos de tiempo de reaccidn y | 2 = 176.53=" 176.5°F. Este valor est& 
muy cerca del punto estacionario que se encontro por examen visual en la grafica de contorno de la figura 
11-11. A1 utilizar la ecuacion 11-8, la respuesta predicha en el punto estacionario puede encontrarse 
como y, = 80.21. 
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El andlisis canonico que se describe en esta section tambidn puede usarse para caracterizar la super- 
ficie de respuesta. Primero es necesario expresar el modelo ajustado en la forma canonica (ecuacion 
11-9). Los eigenvalores X l y 2 Z son las rafces de la ecuacidn de determinantes 


|B— AI| = 0 


—1.376—2 

0.1250 


0.1250 

- 1 . 001-2 


= 0 


que se reduce a 

X 2 +2.37882 + 1.3639= 0 

Las rafces de esta ecuacion cuadrdtica son2 : = -0.9641 y2 2 = -1.4147. Por lo tanto, la forma canonica del 
modelo ajustado es 

y= 80.21-0. 964 lw/ - 1.4147w 2 2 

Puesto que tanto 2 X como2 2 son negativas y el punto estacionario esta en la regidn de exploration, se con- 
cluye que el punto estacionario es un maxi mo. 


En algunos problemas MSR puede ser necesario encontrar la relation entre las variables canOnicas 
{*',} y las variables del diseno {x,}. Esto es particularmente cierto cuando es imposible operar el proceso 
en el punto estacionario. Como una ilustraciOn, suponga que en el ejemplo 11-2 el proceso no pudo ope- 
rarse en £j = 87 minutos y | 2 = 176.5°F debido a que esta combination de factores resulta en un costo ex- 
cesivo. Se quiere “regresar” ahora del punto estacionario a un punto con un costo menor sin incurrir en 
pdrdidas considerables en el rendimiento. La forma canOnica del modelo indica que la superficie es me- 
nos sensible a la pOrdida de rendimiento en la direction w x . La exploraciOn de la forma canOnica requiere 
convertir los puntos del espacio (tv l5 *v 2 ) en puntos del espacio (x x , x 2 ). 

En general, las variables x se relacionan con las variables canOnicas w por 

w — M'(x - x s ) 

donde M es una matriz ortogonal (k X k). Las columnas de M son los eigenvectores normalizados asocia- 
dos con {2,}. Es decir, si m, es la columna i-esima de M, entonces m, es la soluci6n de 

(B - 2,I)m ( = 0 (11-10) 

para la que = 1. 

El procedimiento se ilustra usando el modelo de segundo orden ajustado del ejemplo 1 1-2. Para2 x = 
-0.9641, la ecuaciOn 11-10 queda como 


(-1-376+0.9641) 

0.1250 

A i" 



0.1250 

(-1.001 + 0.9641) 

."*21. 


0 


o 

— 0.4129m n +0.1250m 21 = 0 
0.1250m n — 0.0377m 21 = 0 

Quiere obtenerse la solution normalizada de estas ecuaciones, es decir, aquella para la que +m\ x = 1. 
No existe una solution unica para estas ecuaciones, por lo que lo mas conveniente es asignar un valor ar- 
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bitrario auna de las incdgnitas, resolver el sistemay normalizar la solucidn. A1 hacer m' 21 = 1, se encuentra 
m’ n = 0.3027. Para normalizar esta solucion, m’ n y m \ ;1 se dividen entre 

^Kf+K) ! = V(0.3027) 2 +(1) 2 = 1.0448 
Se obtiene asi la solucidn normalizada 


w„ 


1.0448 


0.3027 

1.0448 


= 0.2897 


y 


m 21 = 


1.0448 


1 

1.0448 


= 0.9571 


que es la primera columna de la matriz M. 

Utilizando A 2 * -1.4147 puede repetirse el procedimiento anterior, obteniendose m 12 = -0.9574 y 
m 22 = 0.2888 como la segunda columna de M. Por lo tanto, se tiene 


M= 


'0.2897 -0.9574' 
0.9571 0.2888 


La relacidn entre las variables w y x es 


V 


' 0.2897 

0.9571' 

, W 2. 


-0.9574 

0.2888 


X- 0.389 
x 2 — 0.306 


o 

*Vj = 0.2897(x 1 - 0.389)+ 0.9571(* 2 - 0.306) 
w 2 = -0.9574 (jc 1 - 0.389)+0.2888(x 2 - 0.306) 

Si quisiera explorarse la superficie de respuesta en la vecindad del punto estacionario, podrian determi- 
narse los puntos apropiados en los cuales hacer las observaciones en el espacio (w„ w 2 ) y usar despuds la 
relacidn anterior para convertir estos puntos en el espacio (Xi,x 2 ) para que puedan realizarse las corridas. 


1 1-3.3 Sistemas de cordilleras 

No es raro encontrar variaciones de las superficies de respuesta con maximos o minimos puros o con pun- 
tos silla estudiadas en la seccidn anterior. Los sistemas de cordilleras, en particular, son muy comunes. 
Considere la forma candnica del modelo de segundo orden presentado anteriormente en la ecuacidn 
11-9: 

9= % +A 1 w 1 2 +A 2 w> 2 + ••• +X k w 2 k 

Suponga ahora que el punto estacionario x, esta dentro de la regidn de experimentacidn; ademas, sea que 
una o mds de las A, sean muy pequenas (por ejemplo, A ; = 0). Entonces la variable de respuesta es muy in- 
sensible a las variables m>, multiplicadas por las A, pequenas. 

En la figura 1 1-12 se presenta una grafica de contomo en la que se ilustra esta situacion para k = 2 va- 
riables con An = 0. (En la prdctica, A 2 estarfa cerca de cero pero no serfa exactamente igual a cero.) En teo- 
rfa, el modelo candnico para esta superficie de respuesta es 

y=y s +A 2 w 2 2 
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x 2 W 2 x 2 



Figura 11-12 Gr^fica de contomo de un sistema Figura 11-13 Grafica de contorno de un sistema de 

de cordilleras estacionarias. cordilleras crecientes. 


conA 2 negativa. Observe que el marcado estiramiento en la direccion w, ha resultado en una linea de cen- 
tros en y = 70 y el dptimo puede tomarse en cualquier lugar a lo largo de esta linea. A este tipo de superfi- 
cie de respuesta se le llama sistema de cordilleras estacionarias. 

Si el punto estacionario esta muy apartado de la region de exploracidn para el ajuste del modelo de 
segundo orden y una A, (o m&s) esta cerca de cero, entonces la superficie puede ser un sistema de cordille- 
ras crecientes. En la figura 11-13 se ilustra una cordillera creciente para k = 2 variables con A, cerca de 
cero y A 2 negativa. En este tipo de sistema de cordilleras no pueden hacerse inferencias acerca de la verda- 
dera superficie o del punto estacionario porque x, est& fuera de la region donde se ha ajustado el modelo. 
Sin embargo, la exploracidn adidonal est& garantizada en la direccion w x . Si A 2 hubiera sido positiva, este 
sistema se habria llamado cordillera descendente. 

11-3.4 Respuestas multiples 

Muchos problemas de superficies de respuesta incluyen el analisis de varias respuestas, como en el ejem- 
plo 11-2, donde el experimentador midid tres. En dicho ejemplo, el proceso se optimizd unicamente con 
respecto a la respuesta rendimiento y v 

La consideracidn simultdnea de respuestas multiples requiere construir primero un modelo de super- 
ficie de respuesta apropiado para cada respuesta y despues intentar encontrar un conjunto de condicio- 
nes de operacidn que optimice en cierto sentido todas las respuestas o que al menos las mantenga en los 
rangos deseados. Un estudio completo del problema de las respuestas multiples se ofrece en Myers y 
Montgomery [85a], 

En el ejemplo 11-2 pueden obtenerse modelos para las respuestas viscosidad y peso molecular (y 2 y y 3 , 
respectivamente) de la siguiente manera: 

5> 2 = 70.00— 0.16*, — 0.95*. — 0.69* 2 — 6. 69* 2 - 1.25x 1 x 2 
% = 3386.2+ 205.1*! +17.4* 2 

En tdrminos de los niveles naturales del tiempo (£ x ) y la temperatura (| 2 ), estos modelos son 

y 2 = -9030.74+13.393^, +97. 708| 2 

- 275x 10' 2 1 2 - 0. 26757| 2 - 5xl0“ 2 


y 


i> 3 = -6308.8+ 41.025^, +35. 473^ 2 
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En las figuras 11-14 y 11-15 se presentan las graficas de contomo y superficie de respuesta para estos modelos. 

Un enfoque relativamente directo para optiraizar varias respuestas que funciona bien cuando solo 
hay pocas variables en el proceso es la superposicion de las grdficas de contomo de cada respuesta. En la 
figura 11-16 se muestra una grdfica de superposicion para las tres respuestas del ejemplo 11-2, con los 
contomos para los quey, (rendimiento) > 78.5, 62 £ y 2 (viscosidad) £ 68, yy 3 (peso molecular Mn) < 3400. 
Si estos limites representan condiciones importantes que el proceso debe satisfacer, entonces, como se 
muestra en la porcidn no sombreada de la figura 11-16, existen varias combinaciones del tiempo y la tem- 
peratura que resultaran en un proceso satisfactorio. El experimentador puede hacer el examen visual de 



a) La grAfica de contorno 



b) La grAfica de la superficie de respuesta 


Figura 11-14 Gr&fica de contomo y gr&fica de la superficie de 
respuesta de la viscosidad, ejemplo 11-2, 
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Tiempo 

a) La gr&fica de contorno 



6) La grSfica de la superficie de respuesta 


Figura 11-15 Grlfica de contorno y grafica de la superficie de 
respuesta del peso molecular, ejemplo 112. 


la grafica de contorno para determinar las condiciones de operation apropiadas. Por ejemplo, es posible 
que el experimentador estb ntis interesado en la regibn mas grande de las dos regiones factibles que se 
muestran en la figura 11-16. 

Cuando hay mas de tres variables del diseno, se hace muy complicada la superposicibn de las gr&ficas 
de contorno, ya que la grafica de contorno es bidimensional, y k - 2 de las variables del diseno deben man- 
tenerse constantes para construir la gr&fica. Con frecuencia se necesita una gran cantidad de ensayo y 
error para determinar cuales son los factores que deben mantenerse constantes y que niveles seleccionar 
para obtener la mejor vista de la superficie. Por lo tanto, existe interes practico en mbtodos de optimiza- 
cion mas formales para las respuestas multiples. 
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Figura 11-16 Region del dptimo encontrada superponiendo las su- 
perficies de respuesta del rendimiento, la viscosidad y el peso molecular, 
ejemplo 11-2. 



Un enfoque popular consiste en formular y resolver el problema como un problema de optimizacibn 
restringida. Para ilustrar este enfoque utilizando el ejemplo 11-2, el problema podria formularse como 

M^x y 1 
sujeto a 
62 < y 2 < 68 
y 3 <3400 

Se cuenta con varias tbcnicas numericas que pueden usarse para resolver este problema. En ocasiones se 
hace referenda a estas tbcnicas como metodos de programacibn no lineal* El paquete de software 
Design-Expert resuelve esta versibn del problema utilizando un procedimiento de busqueda directa. Las 
dos soluciones encontradas son 


tiempo ” 83.5 temperatura = 177.1 y 1 = 79.5 

y 

tiempo = 86.6 temperatura = 172.25 % = 79.5 

Observe que la primera solution es la region factible superior (la mbs pequena) del espacio del diseno 
(referirse a la figura 11-16), mientras que la segunda solucion es la regibn mas grande. Ambas soluciones 
est&n muy cerca de los limites de las restricciones. 

Otro enfoque util para la optimizacibn de respuestas multiples es usar la tecnica de optimizacibn si- 
multanea popularizada por Derringer y Suich [37] . Su procedimiento hace uso de las funciones con condi- 
cibn de deseable. El enfoque general consiste en convertir primero cada respuesta y t en una funcion con 
condicion de deseable individual d l que varia en el rango 

0 < d i < 1 


donde si la respuesta y t esta en su meta u objetivo, entonces d t = 1, y si la respuesta esta fuera de una region 
aceptable, d i = 0. Despues las variables del diseno se eligen para maximizar la condicion de deseable global 

D = (d r d 2 O 1 "" 


donde hay m respuestas. 
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Las funciones con condicion de deseable individual estan estructuradas como se indica en la figura 
11-17. Si el objetivo T para la respuesta y es un valor maximo, 

0 y<L 

1 y-LY 


d = 


T-L 

1 , 


L<y<T 

y>T 


( 11 - 11 ) 


cuando la ponderacion r = 1, la funcion con condicion de deseable es lineal. A1 elegir r > 1 se pone mas 
interes en estar cerca del valor objetivo, y cuando se eljge 0 < r < 1 esto tiene menos importancia. Si el ob- 
jetivo para la respuesta es un valor mmimo, 

1 y<T 
'U-yX 


d = 


U-T 

0 


T<y<U 

y>U 


( 11 - 12 ) 


La funcion con condicion de deseable de dos colas que se muestra en la figura ll-17c supone que el obje- 
tivo se localiza entre los limites inferior (L) y superior ( U). y se define como 




0 

y-LY' 


T-L I 
L-y Y 
U-T 
0 


y<L 
L< y<T 

T <y<U 
y>U 


(11-13) 


Se us6 el paquete de software Design-Expert para resolver el ejemplo 11-2 utilizando el enfoque de la 
funcion con condicidn de deseable. Se eligio T = 80 como el objetivo para la respuesta rendimiento, U = 
70, y se fijo la ponderacidn de esta condicion de deseable individual igual a la unidad. Se hizo T = 65 para 
la respuesta viscosidad con L = 62 y £/ - 68 (para ser consistente con las especificaciones), con ambas 
ponderaciones r 1 = r 2 - 1. Por ultimo, se indico que cualquier peso molecular abajo de 3400 era acepta- 
ble. Se encontraron dos soluciones. 


Solucion 1: 


Solncion 2: 


Tiempo = 86.5 
y t = 78.8 


Tiempo = 82 
= 78.5 


Temperatura = 170.5 
y 2 = 65 


Temperatura — 178.8 
y 2 = 65 


D = 0.822 
y 3 = 3287 


D = 0.792 
% = 3400 


La solucion 1 tiene la condicion de deseable global mas alta. Observe que resulta en una viscosidad acor- 
de con el objetivo y en un peso molecular aceptable. Esta solucion esta contenida en Ja mas grande de las 
dos regiones de operacidn de la figura 11-16, mientras que la segunda solucion esta contenida en la region 
mas pequena. En la figura 11-18 se muestran las gr&ficas de la superficie de respuesta y de contomo de la 
funcion con condicion de deseable global D. 



11-3 ANALISIS DE UNA SUPERF1C1E DE RESPUESTA DE SEGUNDO ORDEN 453 



T V y 

b ) El objetivo (bianco) es minimizar y 



c) El objetivo (bianco) es que y est6 tan cerca como sea posible de la especificacibn 


Figura 11-17 Funciones con condicidn de deseables individuates para la optimiza- 
ci6n simult£nea. 



Condicidn de deseable 
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a) Superficie de respuesta 



I.UU W » 

80.00 82,50 85,00 87.50 90.00 


Tiempo 

6) Gr^fica de contorno 


Figura 11-18 Grafica de la superficie de respuesta y de contomo de la funcion con con 
dicion de deseable del ejemplo 11-2. 
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11-4 DISENOS EXPERIMENTALES PARA AJUSTAR 
SUPERFICIES DE RESPUESTA 

El ajuste y an&lisis de superficies de respuesta se facilita en gran medida con la eleccion apropiada del di- 
seno experimental. En esta seccion se revisan algunos aspectos de la seleccion del diseno apropiado para 
ajustar superficies de respuesta. 

Cuando se selecciona un diseno de superficie de respuesta, algunas de las caracteristicas deseables en 
el diseno son las siguientes: 

1. Proporciona una distribution razonable de los puntos de los datos (y en consecuencia informa- 
cion) en toda la region de interes. 

2. Permite que se investigue la adecuation del modelo, incluyendo la falta de ajuste. 

3. Permite que los experimentos se realicen en bloques. 

4. Permite que los disenos de orden superior se construyan secuencialmente. 

5. Proporciona una estimation interna del error. 

6. Proporciona estimaciones precisas de los coeficientes del modelo. 

7. Proporciona un buen perfil de la varianza de prediction en toda la region experimental. 

8. Proporciona una robustez razonable contra los puntos atipicos o los valores faltantes. 

9. No requiere un gran numero de corridas. 

10. No requiere demasiados niveles de las variables independientes. 

11. Asegura la simplicidad del calculo de los par&metros del modelo. 

Estas caracteristicas entran en conflicto en ocasiones, por lo que con frecuencia debe aplicarse la discre- 
cionalidad al seleccionar un diseno. Para mayor information sobre la eleccion de un diseno de superficie 
de respuesta, referirse a Myers y Montgomery [85a], Box y Draper [16b] y Khuri y Cornell [67]. 


1 1-4.1 Disenos para ajustar el modelo de primer orden 

Suponga que quiere ajustarse el modelo de primer orden en k variables 

k 

y=0 i+2a*,+« (ii-i4) 

I 


Hay una clase unica de disenos que minimizan la varianza de los coeficientes de regresion 0 . }. Se trata 
de los disenos de primer orden ortogonales. Un diseno de primer orden es ortogonal si todos los elemen- 
tos que est&n fuera de la diagonal de la matriz (X'X) son cero. Esto implica que la suma de los productos 
cruzados de las columnas de la matriz X sea cero. 

La clase de los disenos de primer orden ortogonales incluye los factoriales 2 k y las fracciones de la se- 
rie 2 en las que los efectos principales no son alias entre si. Al usar estos disenos se supone que los niveles 
bajo y alto de los k factores estan codificados en los niveles usuales ±1. 

El diseno 2 k no permite la estimacidn del error experimental a menos que se hagan replicas de algu- 
nas corridas. Un metodo comun de incluir las replicas en el diseno 2 k es aumentar el diseno con varias ob- 
servaciones en el centro (el puntox, = 0, i = 1, 2, ..., k). La adicion de puntos centrales al diseno 2 k no 
influye en las {/J ; } para i > 1, pero la estimacidn de/l 0 se convierte en el gran promedio de todas las obser- 
vaciones. Ademas, la adicion de puntos centrales no altera la propiedad de ortogonalidad del diseno. En 
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Figura 11-19 El diseno simplex para 
a) k — 2 variables y b) k = 3 variables. 


el ejemplo 11-1 se ilustra el uso de un diseno 2 2 aumentado con cinco puntos centrales para ajustar un mo- 
delo de primer orden. 

Otro diseno de primer orden ortogonal es el diseno simplex. El diseno simplex es una figura de lados 
regulares con k + 1 vertices en k dimensiones. Por lo tanto, el diseno simplex para k = 2 es un triangulo 
equilatero, y para k = 3 es un tetraedro regular. En la figura 11-19 se muestran disenos simplex de dos y 
tres dimensiones. 

1 1-4-2 Disenos para ajustar el modelo de segundo orden 

En el ejemplo 11-2 se hizo la introduction informal (e incluso antes en el ejemplo 6-6) del diseno central 
compuesto o DCC para ajustar un modelo de segundo orden. Se trata de la clase mas popular de disenos 
usados para ajustar estos modelos. En general, el DCC consta de un factorial 2 k (o de un factorial fractio- 
nado de resolution V) con n F corridas, 2k corridas axiales o estrella y n c corridas centrales. En la figura 
11-20 se muestra el DCC para k = 2 y k = 3 factores. 

El despliegue pr&ctico de un DCC surge con frecuencia a travOs de la experimentation secuencial, 
como en los ejemplos 11-1 y 11-2. Es decir, se ha usado un diseno 2 k para ajustar un modelo de primer or- 
den, este modelo ha presentado falta de ajuste, y despues se agregaron las corridas axiales para permitir la 
incorporation de los tOrminos cuadr&ticos en el modelo. El DCC es un diseno muy efitiente para ajustar 
el modelo de segundo orden. Hay dos parametros en el diseno que deben especificarse: la distancia a de 
las corridas axiales al centro del diseno y el numero de puntos centrales n c . A continuation se analiza la 
election de estos dos parametros. 
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x 2 



*3 



Figura 11-20 Disenos centrales compuestos para k = 2 y k = 3. 


Rotabilidad 

Es importante que el modelo de segundo orden proporcione buenas predicciones en toda la regidn de in- 
ters. Una manera de definir “buenas” es requerir que el modelo tenga una varianza razonablcmente 
consistente y estable de la respuesta predicha en los puntos de interes x. Recuerde, por la ecuacidn 10-40, 
que la varianza de la respuesta predicha en algun punto x es 

HKx)]=o 2 x'(X'XJ- 1 x 

Boxy Hunter [17a] propusieron que un diseiio de superficie de respuesta de segundo orden debe ser rota- 
ble. Esto significa que la F[y( x )] es l a misma en todos los puntos x que estan a la misma distancia del cen- 
tra del diseiio. Es decir, la varianza de la respuesta predicha es constante en esferas. 

En la figura 11-21 se muestran los contomos de VF[>(x)] constante para el ajuste del modelo de se- 
gundo orden utilizando el DCC en el ejemplo 11-2. Observe que los contomos de desviacibn estandar 
constante de la respuesta predicha son circulos concentricos. Un diseno con esta propiedad dejara la va- 
rianza de ysin cambio cuando el diseno se rota alrededor del centra (0, 0, ..., 0), de ahl el nombre de dise- 
no rotable. 

La rotabilidad es una base razonable para la seleccibn de un diseno de superficie de respuesta. Puesto 
que la finalidad de la MSR es la optimizacibn, y la localizacibn del bptimo se desconoce antes de correr el 
experimento, tiene sentido el uso de un diseno que proporcione una precisibn de estimacibn igual en to- 
das las direcciones (puede demostrarse que cualquier diseiio de primer orden ortogonal es rotable). 

Un diseiio central compuesto se hace rotable mediante la eleccion de a. El valor de a para la rotabili- 
dad depende del numero de puntos en laporcibn factorial del diseno; de hecho, a = (n F ) w produce un di- 
seno central compuesto rotable, donde n F es el numero de puntos usados en la porcibn factorial del 
diseno. 


El DCC esfbrico 

La rotabilidad es una propiedad esfbrica; es decir, tiene mayor sentido como criterio de diseno cuando la 
regibn de interbs es una esfera. Sin embargo, no es importante tener una rotabilidad exacta para tener un 
buen diseno. De hecho, para una regibn esfbrica de interes, la mejor eleccion de a desde el punto de vista 
de la varianza de prediccibn para el DCC es hacer a = VJc. Este diseno, llamado DCC esfbrico, coloca to- 
dos los puntos factorialesy axiales del diseno sobre la superficie de una esfera de radio VJc. Para una expo- 
sicion mas amplia del tema, ver Myers y Montgomery [85a]. 
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0.3019 0,3484 



Tiempo 


a) Contornos deV 



6) La gr£fica de la superficie de respuesta 


Figura 11-21 Contornos de desviatidn est£ndar cons- 
tante de la respuesta predicha para el DCC rotable, ejem- 
plo 11-2. 


Corridas centrales en el DCC 

La election de a en el DCC esta dictada principalmente por la region de interns. Cuando esta region es 
una esfera, el diseno debe incluir corridas centrales para proporcionar una varianza razonablemente es- 
table de la respuesta predicha. En general, se recomiendan de tres a cinco corridas centrales. 

El diseno de Box-Behnken 

Box y Behnken [13] han propuesto algunos disenos de tres niveles para ajustar superficies de respuesta. 
Estos disenos se forman combinando factoriales 2 k con disenos de bloques incompletos. Los disenos re- 
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Tabla 11-8 Disefio de Box-Behnken 


para tres variables 


Corrida 


*2 

*3 

1 

-1 

-1 

0 

2 

-1 

1 

0 

3 

1 

-1 

0 

4 

1 

1 

0 

5 

-1 

0 

-1 

6 

-1 

0 

1 

7 

1 

0 

-1 

8 

1 

0 

1 

9 

0 

-1 

-1 

10 

0 

~1 

1 

11 

0 

1 

-1 

12 

0 

1 

1 

13 

0 

0 

0 

14 

0 

0 

0 

15 

0 

0 

0 


sultantes suelen ser muy eficientes en terminos del numero requerido de corridas, y son rotables o casi ro- 
tables. 

En la tabla 1 1-8 se muestra el diseno de Box-Behnken para tres variables. El diseno tambi6n se ilustra 
geomdtricamente en la figura 11-22. Observe que el diseno de Box-Behnken es un diseno esfdrico, con to- 
dos los puntos localizados en una esfera de radio V2. Asimismo, el diseno de Box-Behnken no contiene 
ningiin punto en los vertices de la regidn cubica creada por los limites superior e inferior de cada variable. 
Esto podria ser una ventaja cuando los puntos de los vertices del cubo representan combinaciones de los 
niveles de los factores cuya prueba es prohibitivamente costosa o imposible debido a restricciones fisicas 
del proceso. 


Regi6n cuboidal de interns 

Existen muchas situaciones en las que la regidn de interes es cuboidal en lugar de esfdrica. En estos casos, 
una variante util del diseno central compuesto es el diseno central compuesto con centros en las caras o el 
cubo con centros en las caras, en el que a = 1. En este diseno los puntos axiales o estrella se localizan en 
los centros de las caras del cubo, como se muestra en la figura 11-23 para k = 3. Esta variante del diseno 
central compuesto se usa en ocasiones debido a que s61o requiere tres niveles de cada factor, y en la pr&c- 





Figura 11-22 Diseno de Box-Behnken para tres 
factores. 


Figura 11-23 Diseno central compuesto con centros 
en las caras para Ic - 3, 
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Figura 11-25 Disefios equirradiales para dos variables, a) Hexfigono. b) Pen- 
tfigono. 


tica con frecuencia es diffcil cambiar los niveles de los factores. Sin embargo, observe que los disefios cen- 
trales compuestos no son rotables. 

El cubo con centros en las caras no requiere tantos puntos centrales como el DCC esferico. En la 
prfictica, n c = 2 o 3 es suficiente para proporcionar una buena varianza de prediction en toda la region ex- 
perimental. Cabe sefialar que en ocasiones se emplearfin mas corridas centrales para dar una estimation 
razonable del error experimental. En la figura 11-24 se muestra la raiz cuadrada de la varianza de predic- 
cidn VF[)(x)] del cubo con centros en las caras para k = 3 con n c = 3 puntos centrales (x 3 = 0). Observe 
que la desviation estfindar de la respuesta predicha es razonablemente uniforme en una portion relativa- 
mente larga del espacio del disefio. 


Otros disefios 

Existen muchos otros disefios de superficie de respuesta que en ocasiones son utiles en la practica. Para 
dos variables, podrian usarse disefios compuestos de puntos cuya separation en un circulo es igual y que 
forman polfgonos regulares. Puesto que los puntos del disefio son equidistantes del origen, a estos arre- 
glos con frecuencia se les llama disefios equirradiales. 

Para k » 2, un disefio equirradial rotable se obtiene combinando n 2 s 5 puntos con una separation 
igual en un circulo con n 2 > 1 punto en el centro del circulo. Disefios de particular utilidad para k = 2 son 
el pent&gono y el hexfigono. Estos disefios se muestran en la figura 1 1-25. Otros disefios utiles incluyen el 
disefio compuesto pequefio, el cual consiste en un factorial fractionado en el cubo de resolution III* (los 
efectos principales son alias de las interacciones de dos factores y ninguna de las interacciones de dos fac- 
tores es alias entre si) y las corridas axiales y centrales usuales, y la clase de los disefios hibridos. Estos di- 
sefios pueden ser de valor considerable cuando es importante reducir el numero de corridas tanto como 
sea posible. 

En la tabla 11-9 se muestra un disefio compuesto pequefio para k = 3 factores. Este disefio usa la frac- 
tion un medio estfindar del disefio 2 3 en el cubo, ya que satisface los criterios de la resolution III* . El dise- 
fio tiene cuatro corridas en el cubo y seis corridas axiales, y debe incluir al menos un punto central. Por lo 
tanto, el disefio tiene un minimo de N = 1 1 ensayos, y el modelo de segundo orden en k = 3 variables tiene 
p = 10 parametros por estimar, por lo que se trata de un disefio muy efitiente con respecto al numero de 
corridas. El disefio de la tabla 11-9 tiene n c = 4 corridas centrales. Se seleccionO a- 1.73 para obtener un 
disefio esfOrico debido a que el disefio compuesto pequefio no puede hacerse rotable. 

En la tabla 11-10 se muestra un disefio hibrido para k = 3. Algunos de estos disefios tienen niveles 
irregulares, y esto puede ser un factor limitante para su aplicacion. Sin embargo, se trata de disefios muy 
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Tabla 1 U 9 Diseno compuesto pequeno 
para k = 3 factores 


Orden 

est&ndar 

*t 

*2 

*3 

1 

1.00 

1.00 

- 1.00 

2 

1.00 

- 1.00 

1.00 

3 

- 1.00 

1.00 

1.00 

4 

- 1,00 

- 1.00 

- 1.00 

5 

- 1.73 

0.00 

0.00 

6 

1.73 

0.00 

0.00 

7 

0.00 

- 1.73 

0.00 

8 

0,00 

1.73 

0.00 

9 

0.00 

0,00 

- 1.73 

10 

0.00 

0,00 

1.73 

11 

0.00 

0.00 

0.00 

12 

0.00 

0.00 

0.00 

13 

0.00 

0.00 

0.00 

14 

0.00 

0.00 

0.00 


pequenos, y poseen excelentes propiedades de la varianza de prediccidn. Para mayores detalles acerca de 
los disenos compuestos pequenos y los disenos hibridos, referirse a Myers y Montgomeiy [85a]. 

1 1-43 Formaci6n de bloques en los disenos de superficie de respuesta 

Cuando se usan disenos de superficie de respuesta, con frecuencia es necesario considerar la formacidn 
de bloques para eliminar las variables perturbadoras. Por ejemplo, este problema puede ocurrir cuando 
un diseno de segundo orden se ensambla secuencialmente a partir de un diseno de primer orden, como se 
ilustro en los ejemplos 11-1 y 11-2, Puede transcurrir tiempo considerable entre que se corre el modelo de 
primer orden y se corren los experimentos complementarios requeridos para construir un diseno de se- 


Tabla 1 1-10 Disefio hibrido para k = 3 
factores 


Orden 

estandar 

*i 

*2 

*3 

1 

0.00 

0.00 

1.41 

2 

0.00 

0.00 

- 1.41 

3 

- 1.00 

- 1.00 

0.71 

4 

1.00 

- 1.00 

0.71 

5 

- 1.00 

1.00 

0,71 

6 

1.00 

1.00 

0.71 

7 

1.41 

0.00 

- 0.71 

8 

- 1.41 

0.00 

- 0.71 

9 

0.00 

1.41 

- 0.71 

10 

0.00 

- 1,41 

- 0.71 

11 

0.00 

0.00 

0.00 
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gundo orden, y durante este tiempo las condiciones de prueba pueden cambiar, haciendo necesaria la for- 
macion de bloques. 

Se dice que un diseno de superficie de respuesta se forma de bloques ortogonales si se divide en blo- 
ques tales que sus efectos no afecten las estimaciones de los parimetros del modelo de superficie de res- 
puesta. Si se usa un diseno 2* o 2*" p como un diseno de superficie de respuesta de primer orden, pueden 
usarse los mitodos del capitulo 7 para disponer las corridas en 7 bloques. Los puntos centrales de estos 
disenos deberin asignarse por igual entre los bloques. 

Para hacer la formacidn de bloques ortogonales de un diseno de segundo orden, deben satisfacerse 
dos condiciones. Si hay n b observaciones en el bloque b-esimo, entonces estas condiciones son 


1. Cada bloque debe ser un diseno ortogonal de primer orden; es decir, 

x iu x M = 0 i * j = 0, 1, . . ., k para toda b 

donde x tu y x ju son los niveles de las variables i-dsima y /-esima en la corrida w-esima del experi- 
mento con = 1 para toda u. 

2. La fraction de la suma de cuadrados total para cada variable con que contribuye cada bloque, 
debe ser igual a la fraccidn de las observaciones totales que estin contenidas en el bloque; 
es decir, 


N - . _ i = 1, 2, . . ., k para toda b 

donde N es el numero de corridas del diseno. 

Como un ejemplo de la aplicacidn de estas condiciones, considere un diseno central compuesto rata- 
ble en k = 2 variables con N = 12 corridas. Los niveles yx 2 de este diseno pueden escribirse en la matriz 
del diseno 





Xj x 2 

-1 -1 

1 -1 

-1 1 

1 1 

0 0 

0 0 

1.414 0 

-1.414 0 

0 1.414 

0 -1.414 

0 0 

0 0 


Bloque 1 


Bloque 2 


Observe que el diseno se ha dispuesto en dos bloques, con el primer bloque consistiendo en la porcidn 
factorial del diseno mis dos puntos centrales y el segundo bloque consistiendo en los puntos axiales mis 
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dos puntos centrales adicionales. Es claro que la condicion 1 se satisface; es decir, ambos bloques son di- 
senos de primer orden ortogonales. Para investigar la condicion dos, considere primero el bloque 1 y ob- 
serve que 


Por lo tanto, 


"1 





2 

x 2 

-S 

x 2 

X 2u 

= 4 

u=* 1 


«=1 



N 


N 



1 

x 2 

u 


x 2 

A 2 u 

= 8 

u= 1 


U “ 1 




«=i 


_L 

N 


4^6_ 
8 12 


n 1 = 6 


Asi, la condicion 2 se satisface en el bloque 1. Para el bloque 2 se tiene 

x l = S X L = 4 y 


n 2 = 6 


Por lo tanto, 


"Z 

E x l 


'*2 

N 


4__6 
8 ~ 12 

Puesto que la condicidn 2 tambidn se satisface en el bloque 2, este diseno esta formado de bloques ortogonales. 

En general, el diseno central compuesto siempre puede construirse para hacer la formation de blo- 
ques ortogonales en dos bloques con el primer bloque consistiendo en n F puntos factorials mas n CF pun- 
tos centrales y el segundo bloque consistiendo en n A — 2k puntos axiales m&s fi CA puntos centrales. La 
primera condicidn de la formacion de bloques ortogonales se cumplira siempre independientemente del 
valor que se use para a en el diseno. Para que la segunda condicidn se cumpla, 


+ ”g4 

k f +n Cf 


(11-15) 


El miembro izquierdo de la ecuacidn 11-15 es 2a 2 /n F , y despues de sustituir esta cantidad, la ecuacidn para 
el valor de a que resultard en la formacidn de bloques ortogonales puede resolverse como 


a = 


n F {n A +n CA ) 


L + n CF ) J 


1/2 


(11-16) 
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Este valor de a no dar£ como resultado, en general, un diseno rotable o esferico. Si se requiere que el 


diseno tambien sea rotable, entonces a = (n F ) w y 


, \l/2 _ 

( f) 2 {n F +n CF ) 


(11-17) 


No siempre es posible encontrar un diseno que satisfaga exactamente la ecuacidn 11-17. Por ejemplo, si 
k = 3, n F = 8 y n A = 6, la ecuacidn 11-17 se reduce a 


/oa/2 _ 8(6 +» G4 ) 
* } 2 ( 8 +^) 


2.83 = 


48+8n C4 

16+2n Cf 


Es imposible encontrar valores de n CA y n CF que satisfagan exactamente esta ultima ecuacidn. Sin embar- 
go, observe que si n CF = 3 y n CA = 2, entonces el segundo miembro es 

48+8(2) 


16+2(3) 


= 2.91 


por lo que el diseno se separa en bloques casi ortogonales. En la practica podria relajarse un tanto el re- 
querimiento de la rotabilidad o bien el de la formacidn de bloques ortogonales sin ninguna perdida im- 
portante de informacidn. 

El diseno central compuesto es muy versatil en cuanto a su capacidad para incorporar la formacidn 
de bloques. Si k es lo suficientemente grande, la pordon factorial del diseno puede dividirse en dos o mas 
bloques. (El numero de bloques factoriales debe ser una potencia de 2, con la porcidn axial formando un 
solo bloque.) En la tabla 1 1-1 1 se presentan varias disposiciones utiles de la formacidn de bloques para el 
diseno central compuesto. 


Tabla 11-11 Algunos disefios centrales compuestos rotables y casi rotables que se separan en bloques ortogonales 


k 

2 

3 

4 

5 

5 

iRep. 

6 

6 

iRep. 

7 

7 

§Rep. 

Bloque(s) factorial(es) 

n F 

4 

8 

16 

32 

16 

64 

32 

128 

64 

Ntimero de bloques 

1 

2 

2 

4 

1 

8 

2 

16 

8 

Numero de puntos en cada 
bloque 

4 

4 

8 

8 

16 

8 

16 

8 

8 

Numero de puntos centrales 
en cada bloque 

3 

2 

2 

2 

6 

1 

4 

1 

1 

Numero total de puntos en 
cada bloque 

7 

6 

10 

10 

22 

9 

20 

9 

9 

Bloque axial 

4 

6 

8 

10 

10 

12 

12 

14 

14 

n CA 

3 

2 

2 

4 

1 

6 

2 

11 

4 

Numero total de puntos en el 
bloque axial 

7 

8 

10 

14 

11 

18 

14 

25 

18 

Numero total de puntos N del 
disefio 

14 

20 

30 

54 

33 

90 

54 

169 

80 

Valores de a 

Separacidn en bloques ortogonales 

1.4142 

1.6330 

2.0000 

2.3664 

2.0000 

2.8284 

2.3664 

3.3636 

2.8284 

Rotabilidad 

1.4142 

1.6818 

2.0000 

2.3784 

2.0000 

2.8284 

2.3784 

3.3333 

2.8284 
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Cabe destacar dos puntos importantes acerca del analisis de varianza cuando el diseno de superficie 
de respuesta se ha corrido en bloques. El primero se refiere al uso de los puntos centrales para calcular 
una estimation del error puro. S61o los puntos centrales que se corren en el mismo bloque pueden consi- 
derarse como replicas, por lo que el tdr mi no del error puro sdlo puede calcularse dentro de cada bloque. 
Si la variabilidad es consistente en todos los bloques, entonces estas estimaciones del error puro podrian 
agruparse. El segundo punto se refiere al efecto de bloque. Si el diseno se forma de bloques ortogonales 
en m bloques, la suma de cuadrados de los bloques es 


SS 


Bloques 




G 2 

N 


(11-18) 


donde B b es el total de las n h observaciones en el bloque b-esimo y G es el gran total de las N observaciones 
en los m bloques. Cuando los bloques no son exactamente ortogonales, puede usarse la prueba general de 
significacidn de la regresidn (el mdtodo de la “suma de cuadrados extra”) que se describio en el capitulo 10. 


11-4.4 Disenos (dptimos) generados por computadora 

Los disenos estandares de superficie de respuesta estudiados en las secciones anteriores, como el diseno 
central compuesto y el diseno de Box-Behnken y sus variantes (como el cubo con centros en las caras) , son 
de uso generalizado porque son disenos bastante generales y flexibles. Si la region experimental es un 
cubo o una esfera, de manera tipica existe un diseno de superficie de respuesta que sera aplicable al pro- 
blema. Sin embargo, ocasionalmente un experimentador se encuentra con una situacidn en la que el dise- 
no estandar de superficie de respuesta puede no ser una eleccidn obvia. Los disenos generados por 
computadora son una altemativa por considerar en estos casos. 

Hay tres situaciones en las que puede ser apropiado algun tipo de diseno generado por computadora. 

1. Una region experimental irregular. Si la regidn de interes del experimento no es un cubo o una esfera, 
los disenos estandares quiza no sean la mejor election. Las regiones de inter6s irregulares ocurren con 
bastante frecuencia. Por ejemplo, un experimentador esta investigando las propiedades de un adhesivo 
particular. El adhesivo se aplica a dos piezas y despuds se cura a una temperatura elevada. Los dos facto- 
res de interds son la cantidad de adhesivo aplicada y la temperatura de curado. En los rangos de estos dos 
factores, tornados como -1 a + 1 en la escala de la variable codificada usual, el experimentador sabe que si 
se aplica muy poco adhesivo y la temperatura de curado es muy baja, las piezas no se pegaran satisfacto- 
riamente. En tdrminos de las variables codificadas, esto lleva a una restriction sobre las variables del dise- 
no, por ejemplo 

— 1.5<Xj +x 2 

donde Xj representa la cantidad aplicada de adhesivo yx 2 la temperatura. Ademas, si la temperatura es de- 
masiado elevada y se aplica mucho adhesivo, las piezas resultaran danadas por la fatiga terniica o bien 
ocurrM un pegado inadecuado. Por lo tanto, hay otra restriccidn sobre los niveles de los factores 

Xj +x 2 < 1 

En la figura 11-26 se muestra la regidn experimental que resulta de aplicar estas restricciones. Observe 
que las restricciones eliminan de hecho dos de los vertices del cuadrado, produciendo una region experi- 
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Figura 11-26 Regibn restringida del diseno en dos variables. 


mental irregular (en ocasiones a estas regiones irregulares se les llama “latas abolladas”). No existe nin- 
gtin diseno de superficie de respuesta estandar que se ajuste exactamente a esta regibn. 

2. Un modelo no estdndar. Por lo general, un experimentador elige un modelo de superficie de respues- 
ta de primer o de segundo orden, consciente de que este modelo empirico es una aproximacidn del verda- 
dero mecanismo subyacente. Sin embargo, en ocasiones el experimentador puede tener un conocimiento 
o idea especial acerca del proceso bajo estudio que puede sugerir un modelo no est&ndar. Por ejemplo, el 
modelo 

y= Po + Pl X l + Pl X 2 + Pn x i x 2 +Pn x i +P22 X 2 
^Pm x i X 2 + Pvm x \ x 2 "*" £ 

puede ser de interns. El experimentador estaria interesado en obtener un diseno eficiente para ajustar 
este modelo reducido de cuarto grado. Como otra ilustracion, en ocasiones se encuentran problemas de 
superficie de respuesta en los que algunos de los factores del diseno son variables categoricas. No hay di- 
sehos de superficie de respuesta estandares para esta situation (referirse a Myers y Montgomery [85a] 
para un estudio de las variables categoricas en problemas de superficie de respuesta). 

3. Requerimientos inusuales para el tamano de la muestra. Ocasionalmente, un experimentador quiz& 
necesite reducir el numero de corridas requeridas en un diseno est&ndar de superficie de respuesta. Por 
ejemplo, suponga que se pretende ajustar un modelo de segundo orden en cuatro variables. El diseno 
central compuesto para esta situacion requiere entre 28 y 30 corridas, dependiendo del numero de puntos 
centrales seleccionados. Sin embargo, el modelo solo tiene 15 terminos. Si las corridas tienen un costo 
muy elevado o se llevan mucho tiempo, el experimentador querra un diseno con menos ensayos. Aun 
cuando los disenos generados por computadora pueden usarse para este fin, por lb general se cuenta con 
enfoques mejores. Por ejemplo, puede construirse un diseno compuesto pequeiio para cuatro factores 
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con 20 corridas, incluyendo cuatro puntos centrales, y tambi6n se cuenta con un diseno hibrido con ape- 
nas 16 corridas. Estas son en general elecciones superiores al uso de un diseno generado por computado- 
ra para reducir el numero de ensayos. 

Gran parte del desarrollo de los disenos generados por computadora se deriva del trabajo de Kiefer 
[65a, b] y Kiefer y Wolfowitz [66] en la teoria de los disenos optimales. Por diseno optimal se entiende un 
diseno que es “mejor” con respecto a algun criterio. Se requieren programas de computadora para cons- 
truir estos disenos. El enfoque usual es especificar un modelo, determinar la region de interes, seleccio- 
nar el numero de corridas que deber&n hacerse, especificar el criterio de optimalidad y despues elegir los 
puntos del diseno de un conjunto de puntos candidates que el experimentador considerarfa usar. De ma- 
nera tipica, los puntos candidates son una matriz de puntos distribuidos en la region factible del diseno. 

Hay varios criterios de optimalidad populares. Quiza el de uso mas generalizado es el criterio de opti- 
malidad D. Se dice que un diseno es optimal D si 

l(x'x)- 1 ! 


se minimiza. Ocurre que un diseno optimal D minimiza el volumen de la region de confianza conjunta 
para el vector de los coeficientes de regresion. Una medida de la eficiencia relativa del diseno 1 respecto 
del diseno 2 de acuerdo con el criterio D esta dada por 


D = 


' i(x;x 2 n 


\Vp 

/ 


(11-19) 


donde Xj y X 2 son las matrices X de los dos disenos y p es el numero de par&metros del modelo. 

El criterio de optimalidad^ s61o se ocupa de las varianzas de los coeficientes de regresion. Un diseno 
es optimal^ si minimiza la suma de los elementos de la diagonal principal de (X'X) -1 [a esta se le llama la 
traza de (X'X) -1 , denotada generalmente como tr(X'X)" 1 ]. Por lo tanto, un diseno optimal^ minimiza la 
suma de las varianzas de los coeficientes de regresion. 

Puesto que muebos experimentos de superficie de respuesta se refieren a la prediccion de la respires- 
ta, los criterios de la varianza de prediccion son de gran interds practico. Quizas el mas popular de estos 
criterios sea el criterio de optimalidad G. Se dice que un diseno es optimal G si minimiza la varianza de 
prediccion escalada maxima en la region del diseno. Es decir, si el valor maxi mo de 

mm\ 


en la region del diseno es un minimo, donde N es el numero de puntos del diseno. Si el modelo tiene p pa- 
rametros, la eficiencia G de un diseno es precisamente 



max 


mm] 


( 11 - 20 ) 


El criterio Fconsidera la varianza de prediccion en un conjunto de puntos de inter6s en la region del dise- 
no, por ejemplo x„ x 2 , ..., x m . El conjunto de puntos podria ser el conjunto de candidatos del que se selec- 
ciono el diseno, o podria ser alguna otra coleccion de puntos que tienen un significado especifico para el 
experimentador. Un diseno que m inimiz a la varianza de prediccion promedio en este conjunto de m pun- 
tos es un diseno optimal V. 

En conjunto, a los criterios de diseno que se han venido estudiando suele llamarseles criterios de op- 
timalidad alfabetica. Existen algunas situaciones en las que el diseno optimal alfabetico se conoce o bien 



11-4 DISENOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA 469 


puede construirse analiticamente. Un buen ejemplo es el diseno 2 k , que es optimal D, A, G y Fpara ajus- 
tar el modelo de primer orden en k variables o para ajustar el modelo de primer orden con interaccidn. 
Sin embargo, en la mayorla de los casos el diseno optimal no se conoce y debe emplearse un algoritmo ba- 
sado eneomputadora para encontrar un diseno. Muchos paquetes de software de estadistica que sopor- 
tan experimentos disenados cuentan con esta capacidad. La mayoria de los procedimientos para construir 
disenos se basan en el algoritmo de intercambio. En esencia, el experimentador selecciona una matriz de 
puntos candidatos y un diseno inicial (quizci al azar) a partir de este conjunto de puntos. Entonces el algo- 
ritmo intercambia los puntos que estan en la matriz, pero no en el diseno, con los puntos que est&n actual- 
mente en el diseno, en un esfuerzo por mejorar el criterio de optimalidad seleccionado. Debido a que no 
se evaluan explicitamente todos los disenos posibles, no hay garantia de que se ha encontrado un diseno 
optimal, pero el procedimiento de intercambio suele asegurar que se obtiene un diseno que esta “cerca” 
del optimal. Algunas implementaciones repiten varias veces el proceso de construccidn del diseno, empe- 
zando con disenos iniciales diferentes, para incrementar la posibilidad de que se obtendr& un diseno final 
que est6 muy cerca del optimal. 

Para ilustrar algunas de estas ideas, considere el experimento del adhesivo expuesto anteriormente y 
que llevo a la regidn experimental irregular de la figura 11-26. Suponga que la respuesta de interes es la 
fuerza de desprendimiento y que quiere ajustarse un modelo de segundo orden para esta respuesta. En la 
figura 11 -27a se muestra un diseno central compuesto con cuatro puntos centrales (12 corridas en total) 
inscrito dentro de esta regidn. Se trata de un diseno que no es rotable, pero es el DCC m£s grande que 
puede ajustarse dentro del espatio del diseno. Para este diseno | (X'X)' 1 1 = 1.852 E-2, y la traza de (X'X) 1 
es 6.375. En la figura 11 -27a tambien se muestran los contornos de desviacidn est&ndar constante de la 
respuesta predicha, calculada suponiendo que 0=1. En la figura 11-27 b se muestra la gr&fica de superfi- 
cie de respuesta correspondiente. 

En la figura ll-28a y en la tabla 1 1-12 se muestra un diseno optimal!) de 12 corridas para este proble- 
ma, generado con el paquete de software Design-Expert. Para este diseno, | (X'X) -1 1 = 2.153 E-4. Observe 
que el criterio D es considerablemente mejor para este diseno que el DCC inscrito. La eficiencia relativa 
del DCC inscrito con respecto al diseno optimal D es 


B. = 


fi(x;x 2 )-i 


\i/p 


l i(x;x I r i u 


/00002153V' 6 
{ 0.01852 ) 


= 0.476 


Es decir, el DCC inscrito tiene una eficiencia de solo 47.6% que la del diseno optimal D. Esto implica que 
tendrian que hacerse 1/0.476 = 2.1 r6plicas del DCC (o aproximadamente el doble) para tener la misma 
precision de la estimacion de los coeficientes de regresion que la que se consigue con el diseno optimal D. 
La traza de (X'X)' 1 es 2.516 para el diseno optimal D, lo cual indica que la suma de las varianzas de los 
coeficientes de regresidn es considerablemente mas pequena para este diseno que para el DCC. En las fi- 
guras ll-28a y b se muestran tambidn los contornos de desviacidn est&ndar constante de la respuesta pre- 
dicha y la grafica de la superficie de respuesta asociada (suponiendo que a = 1). En general, los contornos 
de la desviacidn est&ndar de la prediccion son mas bajos para el diseno optimal!) que para el DCC inscri- 
to, particularmente cerca de los limites de la region de interns, donde el DCC inscrito no incluye ninguno 
de los puntos del diseno. 

En la figura ll-29a se muestra un tercer diseno, creado al tomar las dos replicas de los vertices de la 
regidn en el diseno optimal D y pasarlas al centro del diseno. Esto podrta ser una idea util, ya que la figura 
11 - 28b muestra que la desviacion estdndar de la respuesta predicha se incrementa ligeramente cerca del 
centro de la regi6n del diseno para el diseno optimal!). En la figura ll-29a se muestran tambidn los con- 
tomos de desviacidn est&ndar constante de la prediccion para este diseno optimal D modiflcado, y en la fi- 
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EDO 


0.60 


H 0.00 


-0.60 



- 1.00 


-0.60 


0.00 


0.60 


1.00 


(a) El dlseflo y los contornos de 'tV $[w)]/e i constant© 



ib) La grdfica de superficie de respuesta 

Figura 11-27 Un diseno central compuesto inscrito para la regidn restringida del diseno 
de la figura 11-26, 
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Tabla 11-12 

Diseno optimal D para la 
regidn restringida de la 
figura 11-26 

Orden 

est&ndar 


x 2 

1 

- 0.50 

- 1.00 

2 

1.00 

0.00 

3 

- 0.08 

- 0.08 

4 

- 1.00 

1.00 

5 

1.00 

- 1.00 

6 

0.00 

1.00 

7 

- 1.00 

0.25 

8 

0,25 

- 1.00 

9 

- 1.00 

- 0.50 

10 

1.00 

0.00 

11 

0.00 

1.00 

12 

- 0.08 

- 0.08 


gura 11-296 se muestra la grafica de la superficie de respuesta. El criterio D para este diseno es | (X'X)' 1 1 
= 3.71 E-4, y la eficiencia relativa es 

= fKX^Tlf = (00002153V /6 = 

* (|(x;x ) r 1 |j 1 0.000371 ) 

Es decir, este diseno es casi tan eficiente como el diseno optimal JO. La traza de (X'X) -1 es 2.448 para este 
diseno, un valor ligeramente mayor que el que se obtuvo para el diseno optimal D. Los contornos de des- 
viacion estandar constante de la prediction para este diseno dan la impresibn visual de ser al menos tan 
buenos como los del diseno optimal D, particularmente en el centro de la regibn. 

Los disenos generados por computadora con base en los criterios de optimalidad alfabetica pueden 
ser ciertamente utiles en situaciones en las que la region experimental no es ni esferica ni cuboidal. Sin 
embargo, no son sustitutos de los disenos est&ndares en la mayoria de los problemas. Los disenos optima- 
les alfabbticos se generan apegandose estrictamente a un solo criterio y, como se senalo al principio de la 
section 11-4, donde se enlistaron varios criterios para diferentes disenos, incluyen varios que son de ca- 
racter un tanto cualitativo o subjetivo. En problemas experimentales reales, por lo general hay muchos 
criterios que es necesario evaluar para seleccionar un diseno. Para un estudio mas amplio de este tema, 
referirse a Myers y Montgomery [85a, capitulo 8]. 


11-5 EXPERIMENTOS CON MEZCLAS 

En las secciones anteriores se presentaron disenos de superficie de respuesta para aquellas situaciones en 
las que los niveles de cada factor son independientes de los niveles de otros factores. En los experimentos 
con mezdas, los factores son los componentes o ingredientes de una mezclay, por consiguiente, sus nive- 
les no son independientes. Por ejemplo, six^Xj, ...,x p denota las proporciones d ep componentes de una 
mezcla, entonces 

0<X; <1 1=1, 2, ..., P 


y 


x x +x 2 + +x p = 1 (es decir, 100%) 



1.00 


0.50 


h" 0.00 


-0.50 4 


- 1.00 1 

- 1.1 


T 


1.035 
0.866 
0.736 

|J 0.587 i 
0.437 


1.0C 


Figura 11-29 

1 i 
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Figura 11-30 Espacio de los factores Figura 11-31 Sistema coordenado trilineal 

restringidos para mezclas con a)p = 2 
componentes yb)p = 3 componentes. 


Estas restricciones se ilustran graficamente en la figura 11-30 para p — 2 yp = 3 componentes. Para dos 
componentes, el espacio de los factores del diseno incluye todos los valores de los dos componentes que 
estdn sobre el segmento de recta + x 2 = 1 , con cada componente siendo acotado por 0 y 1 . Con tres 
componentes, el espacio de la mezcla es un tri&ngulo con vertices que corresponden a las formulaciones 
que son mezclas puras (mezclas que son 100% de un solo componente). 

Cuando hay tres componentes en la mezcla, la region experimental restringida puede representarse 
convenientemente en papel milimetrico trilineal, como se muestra en la figura 11-31. Cada uno de los 
tres lados de la grSfica de la figura 11-31 representa una mezcla que no contiene nada de alguno de los 
tres componentes (el componente indicado en el vertice opuesto). Las nueve lrneas de graduation en 
cada direction marcan incrementos de 10% en el componente respectivo. 

Los disenos simplex se usan para estudiar los efectos de los componentes de una mezcla sobre la va- 
riable de respuesta. Un diseno simplex reticular { p,m } parap componentes consta de los puntos defini- 
dos por los siguientes arreglos de las coordenadas: las proporciones asumidas por cada componente 
toman los m + 1 valores que esttrn separados por una distancia igual de 0 a 1, 

= i = 1 > 2 '-’P (H-21) 

y se usan todas las combinaciones posibles (mezclas) de las proporciones de la ecuaci6n 11-21. Como un 
ejemplo, sean p = 3 y m = 2. Entonces 

= 0,j,l 


i = 1, 2, 3 
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*, - 1 *i - 1 



Reticula [4, 2] Reticula [4, 3] 


Figura 11-32 Algunos disenos simplex reticulares para p = 3 y p = 4 componentes, 

y el diseno simplex reticular consta de las seis corridas siguientes: 

( Xl ,x 2 ,x 3 ) = (1, 0, 0), (0, 1, 0), (0, 0,1), (2.2 > 0). (2 , 0 , j), (0, i , i) 

En la figura 11-32 se ilustra este diseno. Los tres vertices ( 1 , 0 , 0 ), ( 0 , 1 , 0 ) y ( 0 , 0 , 1 ) son las mezclas puras, 
mientras que los puntos (7, 7, 0), (7, 0, 7) y (0, 7, 7) son mezclas binarias o mezclas de dos componentes lo- 
calizadas en los puntos medios de los tres lados del tri&ngulo. En la figura 11-32 se muestran tambidn los 
disenos simplex reticulares { 3 , 3 }, { 4 , 2 } y { 4 , 3 }. En general, el numero de puntos en un diseno simplex 
reticular {p, m } es 

(p+m-1)! 

m!(p-l)! 

Una altemativa del diseno simplex reticular es el diseno simplex de centroide. En un diseno simplex 
de centroide con/> componentes, hay 2 P ~\ puntos, que corresponden alasp permutaciones de (1, 0, 0, ..., 
0), las ( l ) permutaciones de (7, 7, 0 0), las ( 3 ) permutaciones de (7, 7, 7, 0, ..., 0) y el centroide glo- 
bal (j, f, ~). En la figura 11-33 se muestran algunos disenos simplex de centroide. 



Figura 11-33 Disenos simplex de centroide con a)p = 3 componentes yb)p = 4 componentes. 
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Una critica a los diseiios simplex descritos antes es que la mayoria de las corridas ocurren en la fron- 
tera de la region y, por consiguiente, incluyen s61o p - 1 de los p componentes. Suele ser deseable aumen- 
tar el diseiio simplex reticular o de centroide con puntos adicionales en el interior de la region donde las 
mezclas estar&n formadas por la totalidad de los p componentes. Para un estudio mas amplio, ver Cornell 
[33] y Myers y Montgomery [85a], 

Los modelos para mezclas difieren de los polinomios usuales empleados en los diseiios de superficie 
de respuesta debido a la restriccidn Xv, = 1. Las formas estandares de los modelos para mezclas que se 
usan ampliamente son 

Lineal: 

= ( 11 - 22 ) 

1=1 

Cuadratico: 

£(y) = 2 Pm +2X Pa x ‘ x j (ii -23 ) 

i = 1 i<j 

Cubico completo: 

£(y) = 'Z P* + 2 X Pij x i x j 

i= 1 i<j 

+2X d n x i x j( x i- x i) (ll- 24 ) 

i< j<lc 

Cubico especial: 

E(y)=^ P‘i x ‘ x i 

1?j (11-25) 

Pijk x i x j x k 

i< j<k 

Los t6rminos de estos modelos tienen interpretaciones relativamente simples. En las ecuaciones 
11-22 a 11-25, el par£metro /?, representa la respuesta esperada para la mezcla pur ax, = 1 yx t , = 0 cuando 
j * i. A la porcion 2 se le llama porcidn de mezcla lineal. Cuando hay curvatura derivada de una 
mezcla no lineal entre pares de componentes, los parametros /3, ; representan una mezcla sinergica 0 bien 
antagonica. Los terminos de ordenes superiores suelen ser necesarios en los modelos para mezclas por- 
que 1) los fen6menos estudiados pueden ser complejos y 2) la region experimental con frecuencia es la re- 
gion de operabilidad completa y, en consecuencia, es grande y requiere un modelo elaborado. 

EJEMPLO 11-3 

Una mezcla de tres componentes 

Cornell [33] describe el experimento con una mezcla en el que se combinaron tres componentes — polie- 
tileno (jtj), poliestireno (x 2 ) y polipropileno (x 3 ) — para hilar una fibra que se usara en cortinas. La variable 
de respuesta de interes es la elongaddn del hilo en kilogramos de fuerza aplicada. Se usa un diseiio simplex 
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Tabla 1 1-13 El diseflo simplex reticular {3, 2} para el problema de la elongaci6n del hilo 


IdUla U-U 

Punto del 

Proporciones de los componentes 

Valores observados 

Valor promedio_ 

diseflo 

*i 

*2 

*3 

de la elongacidn 

de la elongacidn (y) 

1 

1 

0 

0 

11.0, 12.4 

11.7 

2 


i 

0 

15.0, 14.8, 16.1 

15.3 

3 

0 

1 

0 

8.8, 10.0 

9.4 

4 

0 

1 

2 

~2 

10.0, 9.7, 11.8 

10.5 

5 

0 

0 

1 

16.8, 16.0 

16.4 

6 

1 

2 

0 

2 

17.7, 16.4, 16.6 

16.9 


reticular para estudiar el producto. El diseflo y las respuestas observadas se muestran en la tabla 11*13. 
Observe que todos los puntos del diseflo incluyen mezclas puras o binarias; es decir, unicamente se usan 
a lo sumo dos de los tres componentes en cualquier formulation del producto. Tambien se corren replicas 
de las observaciones, con dos replicas de cada una de las mezclas puras y tres replicas de cada una de las 
mezclas binarias. La desviacidn estflndar del error puede estimarse a partir de estas replicas de las observa- 
ciones como d = 0.85. Cornell ajusta el polinomio de segundo grado de la mezcla a los datos, obteniendo 

y= 11.7*, +9.4ac 2 +16.4*3 +19.0* l * 2 +11. 4*^ - 9.6* 2 * 3 

Puede demostrarse que este modelo es una representacidn adecuada de la respuesta. Observe que como 
/?3 > jSj > p 2 , se concluiria que el componente 3 (polipropileno) produce el hilo con la elongacidn maxi- 
ma. Ademfls, puesto que /J 12 y /S 13 son positivos, la mezcla de los componentes 1 y 2 o de los componentes 
1 y 3 produce valores mas altos de la elongackm de los que se esperarfan si nos limitaramos a promediar 
las elongaciones de las mezclas puras. Se trata de un ejemplo de los efectos de mezclado “sin6rgicos”. Los 
componentes 2 y 3 tienen efectos de mezclado antagonicos, ya que fi n es negativa. 

En la figura 11-34 se graficanlos contomos de la elongacion, lo cual puede ser de utilidad para inter- 
pretar los resultados. A1 examinar la figura, se observa que si se desea la elongackm maxima, debera ele- 
girse la mezcla de los componentes 1 y 3, la cual estfl formada por aproximadamente 80% del componente 
3 y 20% del componente 1. 





Figura 11-34 Contomos de la elongacion estimada del 
hilo constante en el modelo de segundo orden para la mez- 
cla del ejemplo 11-3. 
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Se senald ya que los disenos simplex reticular y simplex de centroide son disenos de puntos fronte- 
ra. Si el experimentador quiere hacer predicciones acerca de las propiedades de mezclas completas, se- 
ria muy deseable contar con mis corridas en el interior del simplex. Se recomienda aumentar los 
disenos simplex ordinarios con corridas axiales y el centroide global (si el centroide no es ya un punto 
del diseno). 

El eje del componente i es la recta o rayo que se extiende del punto basex, = 0 ,Xj = l/(p - 1), para toda 
j * i, al vdrtice opuesto dondex, = l,x ; = 0 para toda j * i. El punto base siempre se localizard en el cen- 
troide de la frontera de (p - 2) dimensiones del diseno simplex que esta opuesto al vertice x, = 1, x ; = 0 
para toda; * i. [A la frontera se le llama en ocasiones el (p - 2)-llano.] La longitud del eje del componente 
es una unidad. Los puntos axiales se situan sobre los ejes de los componentes a una distancia A del cen- 
troide. El valor m£ximo de A es (p - l)/p. Se recomienda que las corridas axiales se coloquen a la mitad en- 
tre el centroide del diseno simplex y cada vertice para que A = (p - l)/2p. En ocasiones a estos puntos se 
les llama mezclas de verification axial, porque es una prdctica comun excluirlas cuando se ajusta el mode- 
lo preliminar de la mezcla y usar despues las respuestas en estos puntos axiales para verificar la adecua- 
ci6n del ajuste del modelo preliminar. 

En la figure 11-35 se muestra el diseno simplex reticular {3, 2} aumentado con los puntos axiales. 
Este diseno tiene 10 puntos, con cuatro de ellos en el interior del diseno simplex. La reticula simplex (3, 
3} soportard el ajuste del modelo cubico completo, mientras que la reticula simplex aumentada no lo 
hard; sin embargo, la reticula simplex aumentada permitird al experimentador ajustar el modelo cubico 
especial o agregar al modelo cuadrdtico terminos especiales de cuarto orden, como P 12 ss x i x 2 x l’ La 
reticula simplex aumentada es superior para estudiar la respuesta de mezclas completas en el sentido de 
que puede detectar y modelar la curvature en el interior del tridngulo que no puede tomarse en conside- 
racion por los tdrminos del modelo cubico completo. La reticula simplex aumentada tiene mas potencia 
para detectar la falta de ajuste que la reticula {3, 3}. Esto es de particular utilidad cuando el experimenta- 
dor no estd seguro acerca del modelo apropiado que debe usar y tambien planea construir un modelo se- 
cuendalmente empezando con un polinomio simple (quiza de primer orden), probar el modelo para la 



Figura 11-35 Un diseno simplex reticular aumentado. 
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falta de ajuste, despuds aumentar el modelo con tdrminos de drdenes superiores, probar el nuevo modelo 
para la falta de ajuste y as! sucesivamente. 

En algunos problemas de mezclas surgen restricciones sobre los componentes individuales. Las res- 
tricciones sobre la frontera inferior de la forma 


Sl i = l,2,...,p 


son muy comunes. Cuando sdlo estan presentes restricciones sobre la frontera inferior, la regidn factible 
del diseno sigue siendo un diseno simplex, pero se inscribe dentro de la regidn del simplex original. Esta 
situacidn puede simplificarse mediante la introduction de pseudocomponentes, definidos como 


x. — /. 


x. ~ ■ 


i ml t 


(11-26) 


con 2' = i lj < 1. Entonces 


X 1 +X 2 +• 


•+x„ 



por lo que el uso de pseudocomponentes permite utilizar disenos tipo simplex cuando las fronteras infe- 
riores forman parte de la situaci6n experimental. Las formulaciones especificadas por el disefio simplex 
para los pseudocomponentes se transforman en formulaciones para los componentes originates invirtien- 
do la transformacidn de la ecuatidn 11-26. Es decir, six' es el valor asignado al pseudocomponente i-6si- 
mo en una de las corridas del experimento, el componente i-6simo de la mezcla original es 

(n-27) 


Cuando los componentes tienen restricciones tanto sobre la frontera superior como la inferior, la re- 
gion factible deja de ser un diseno simplex; serS, en cambio, un politopo irregular. Puesto que la region 
experimental no tiene una forma “est£ndar”, los disenos generados por computadora son muy utiles para 
este tipo de problemas de mezclas. 


5JEMPLO 

Formulacidn de una pintura 

Un experimentador esta intentando optimizar la formulacidn de una pintura automotriz de recubrimien- 
to total. Se trata de productos complejos que tienen requerimientos de desempeno muy especificos. El 
cliente quiere, en particular, que la dureza Knoop exceda de 25 y que el porcentaje de sdlidos este abajo 
de 30. El recubrimiento total es una mezcla de tres componentes, que consiste en un mondmero fo), un 
entrelazador (x 2 ) y una resina (x 3 ). Existen restricciones sobre las proporciones de los componentes: 

Xj +Xj +x 3 = 100 
5 < x t < 25 
25 <x 2 <40 
50 < x 3 < 70 

El resultado es la regidn de experimentacidn restringida ilustrada en la figura 11-36. Puesto que la regidn 
de interds no es simplex, se usara un diseno optimal D para este problema. Suponiendo que posiblemente 
ambas respuestas ser&n modeladas con un modelo cuadratico de una mezcla, el diseno optimal D ilustra- 
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Moodmero 

25.00 



Figura 11-36 La regi6n experimental restringida para 
el problema de la formnlacidn de la pintura del ejem- 
plo 11-4 (mostrada en la escala real del componente). 


pintura del ejemplo 1 M 

Orden 

est£ndar Corrida 

Mon6mero Entrelazador Resina Dureza Solidos 

*3 y\ y-i 

1 

2 

17*50 

32*50 

50*00 

29 

9.539 

2 

1 

10.00 

40.00 

50.00 

26 

27.33 

3 

4 

15.00 

25.00 

60.00 

17 

29*21 

4 

13 

25*00 

25.00 

50.00 

28 

30,46 

5 

7 

5.00 

25,00 

70,00 

35 

74.98 

6 

3 

5*00 

32*50 

62.50 

31 

31*5 

7 

6 

11.25 

32.50 

56.25 

21 

15.59 

8 

11 

5.00 

40.00 

55.00 

20 

19.2 

9 

10 

18.13 

28.75 

53*33 

29 

23*44 

10 

14 

8.13 

28,75 

63.13 

25 

32.49 

11 

12 

25,00 

25.00 

50.00 

19 

23*01 

12 

9 

15.00 

25.00 

60.00 

14 

41.46 

13 

5 

10.00 

40.00 

50.00 

30 

32.98 

14 

8 

5.00 

25.00 

70.00 

23 

70.95 
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Tabla 1 1-15 Ajuste del modelo para la respuesta dureza 


Response: hardness 

ANOVA for Mixture Quadratic Model 


Analysis of variance table [Partial sum 

of squares] 




Sum of 

Mean 

F 


Source 

Squares 

DF Square 

Value 

Prob > F 

Model 

279.73 

5 55.95 

2.37 

0.1329 

Linear Mixture 

29. 13 

2 14.56 

0.62 

0.5630 

AB 

72.61 

1 72.61 

3.08 

0.1174 

AC 

179.67 

1 179.67 

7.62 

0.0247 

BC 

8.26 

1 8.26 

0.35 

0.5703 

Residual 

188.63 

8 23.58 



Lack of Fit 

63.63 

4 15.91 

0.51 

0.7354 

Pure Error 

125.00 

4 31.25 



Cor Total 

468.36 

13 



Std. Dev. 

4.86 

R-Squared 

0.5973 


Mean 

24.79 

Adj R-Squared 

0.3455 


C.V. 

19.59 

Pred R-Squared 

-0.3635 


PRESS 

638.60 

Adeq Precision 

4,975 



Coefficient 

Standard 

95% Cl 

95% Cl 

Component 

Estimate 

DF Error 

Low 

High 

A-Monomer 

23.81 

1 3.36 

16.07 

31.55 

B-Crosslinker 

16.40 

1 7.68 

’1.32 

34.12 

C-Resin 

29.45 

1 3.36 

21.71 

37.19 

AB 

44.42 

1 25.31 

-13.95 

102.80 

AC 

-44.01 

1 15.94 

-80.78 

-7.25 

BC 

13.80 

1 23.32 

-39.97 

67.57 


Final Equation In Terms of Pseudo Components: 

hardness = 

+23.81 * A 
+16.40 * B 
+29.45 * C 
+44.42 * A * B 
-44.01 * A * C 
+ 13.80 * B * C 


do en la figura 11-36 puede generarse utilizando Design-Expert. Se supuso que, ademas de las seis corridas 
requeridas para ajustar el modelo cuadr&tico de una mezcla, se harlan cuatro corridas diferentes adicio- 
nales para verificar la falta de ajuste y que se harfan replicas de cuatro de estas corridas a fin de proporcio- 
nar una estimacidn del error puro. Design-Expert utilizd los vertices, los centros en los hordes, el centroide 
global y las corridas de verificacidn (los puntos localizados a la mitad entre el centroide y los vertices) 
como los puntos candidatos. 

El diseno con 14 corridas se muestra en la tabla 11-14 junto con las respuestas dureza y sdlidos. Los re- 
sultados del ajuste de modelos cuadrSticos para ambas respuestas se resumen en las tablas 11-15 y 11-16. 
Observe que los modelos cuadriiticos se ajustan muy bien tanto a la respuesta dureza como a la respuesta 
solidos- En estas tablas se muestran las ecuaciones ajustadas para ambas respuestas (en terminos de los 
pseudocomponentes). En las figuras 11-37 y 1 1-38 se muestran las graficas de contomo de las respuestas. 

La figura 11-39 es una grafica de superposici6n de las dos superficies de respuesta, donde se muestra 
el contomo de la dureza Knoop de 25% y el contorno de 30% para los solidos. La regidn factible para este 
producto es el £rea sin sombrear cerca del centra de la grafica. Evidentemente, existen varias elecciones 



Tabla 11-16 Ajuste del modelo para la respuesta sdlidos 


Response: solids 

ANOVA for Mixture Quadratic Model 


Analysis of variance table [Partial sum 

of squares] 




Sum of 


Mean 

F 


Source 

Squares 

DF 

Square 

Value 

Prob > F 

Model 

4297.94 

5 

859.59 

25,78 

<0.0001 

Linear Mixture 

2931.09 

2 

1465.66 

43.95 

<0.0001 

AB 

211.20 

1 

211.20 

6.33 

0.0360 

AC 

285.67 

1 

285.67 

8.57 

0.0191 

BC 

1036.72 

1 

1036.72 

31.09 

0.0005 

Residual 

266.79 

8 

33.35 



Lack of Fit 

139.92 

4 

34.98 

1.10 

0.4633 

Pure Error 

126.86 

4 

31.72 



Cor Total 

4564.73 

13 




Std. Dev. 

5.77 


R-Squared 

0.9416 


Mean 

33.01 


Adj R-Squared 

0.9050 


C.V. 

17.49 


Pred R-Squared 

0.7827 


PRESS 

991.36 


Adeq Precision 

15.075 



Coefficient 


Standard 

95%CI 

95% Cl 

Component 

Estimate 

DF 

Error 

Low 

High 

A-Monomer 

26.53 

1 

3.99 

17.32 

35,74 

B-Crosslinker 

46.60 

1 

9.14 

25.53 

67.68 

C-Resin 

73,23 

1 

3.99 

64.02 

82.43 

AB 

-75.76 

1 

30.11 

-145.19 

-6,34 

AC 

—55.50 

1 

18.96 

—99,22 

-11,77 

BC 

-154.61 

1 

27.73 

-218.56 

-90.67 


Final Equation in Terms of Pseudo Components: 

solids = 

+26.53 * A 
+46.60 * B 
+73.23 * C 
-75.76 * A * B 
-55.50 * A * C 
-154.61 * B * C 


Mon6mero 

25.00 



Entrelazador Resina 

Figure 11-37 Grlfica de contomo de la respuesta dureza 
Knoop, ejemplo 11-4. 
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Mon6mero 

25.00 



Entrelazador Resina 

Figure 11-38 Gr&fica de contomo de la respuesta sdlidos, 
ejemplo 11-4. 


Morrtmero 

25.00 



45.00 5.00 70.00 


Entrelazador Resina 

Figura 11-39 Grdfica de contomo de las respuestas dureza 
Knoop y porcentaje de s61idos, donde se indica la regidn factible 
para la formulacidn de la pintura. 
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para las proporciones del monomero, el entrelazador y la resina para el recubrimiento total que redunda- 
ra en un producto que satisfaga los requerimientos de desernpefio. 


11-6 OPERACION EVOLUTIVA 

Personal de investigacidny desarrollo aplica con frecuencia la metodologia de superficies de respuesta en 
operaciones de plantas piloto. Cuando se aplica a un proceso de production a gran escala, suele hacerse 
una sola vez (o con poca frecuencia), ya que el procedimiento experimental es relativamente minucioso. 
Sin embargo, las condiciones que fueron optimas para la planta piloto quiza no lo sean para el proceso a 
gran escala. La planta piloto puede producir 2 libras de producto por dfa, mientras que el proceso a gran 
escala puede generar 2000 libras diarias. Esta “escalation” de la planta piloto al proceso de production a 
gran escala da por lo general como resultado la distorsion de las condiciones optimas. Incluso si la planta 
a gran escala empieza a operar en el optimo, con el tiempo se “desvla” de ese punto debido a las variacio- 
nes en las materias primas, los cambios ambientales y el personal de operation. 

Se requiere un mdtodo para el monitoreo y el mejoramiento continuo de un proceso a gran escala 
cuyo objetivo sea mover las condiciones de operation hacia el optimo o despues de una “desviacion”. El 
metodo no debera requerir cambios grandes o repentinos de las condiciones de operation que pudieran 
intemimpir la production. La operation evolutiva (EVOP, por sus siglas en ingles) fue propuesta por Box 
[12c] como un procedimiento de operation con estas caracterfsticas. Esta disenado como un metodo de 
operation rutinaria en la planta quelleva a cabo el personal de manufactura con un minimo de asistencia 
del equipo de investigation y desarrollo. 

La EVOP consiste en introducir de manera sistematica pequenos cambios en los niveles de las va- 
riables de operation bajo consideration. Generalmente se emplea un diseno 2 k para hacer esto. Se su- 
pone que los cambios de las variables son lo suficientemente pequenos para que no ocurran 
perturbaciones serias en el rendimiento, la calidad o la cantidad, pero lo suficientemente grandes 
para descubrir en ultima instancia mejoras potenciales en el desempeno del proceso. Se colectan da- 
tos de las variables de respuesta de interes en cada punto del diseno 2 k . Cuando se ha hecho una ob- 
servation en cada punto de) diseno, se dice que se ha completado un ciclo. Entonces pueden 
calcularse los efectos y las interacciones de las variables del proceso. Finalmente, despues de varios 
ciclos, el efecto de una o mas variables del proceso o sus interacciones sobre la respuesta puede pare- 
cer significativo. En este punto se debe tomar una decision para modificar las condiciones de opera- 
ci6n basicas a fin de mejorar la respuesta. Cuando se han detectado las condiciones mejoradas, se 
dice que se ha terminado una fase. 

Para probar la signification de las variables e interacciones del proceso, se necesita una estimation 
del error experimental. Esta se calcula a partir de los datos del ciclo. Ademas, el diseno 2 k se centra por lo 
general en tomo a las mejores condiciones de operation actuales. Mediante la comparacion de la res- 
puesta en este punto con los 2 k puntos de la portion factorial, es posible verificar la curvatura o cambio en 
la media (CIM, por sus siglas en ingles); es decir, si el proceso en realidad se centra en el maximo, por 
ejemplo, entonces la respuesta en el centro debera ser significativamente mayor que las respuestas en los 
puntos perifericos del diseno 2 k . 

En teoria, la EVOP puede aplicarse a k variables del proceso. En la practica es comun considerar s61o 
dos o tres variables. Se presentara un ejemplo del procedimiento para dos variables. Boxy Draper [16a] 
ofrecen un estudio detallado del caso de tres variables, incluyendo las formas y hojas de trabajo necesa- 
rias. Myers y Montgomery [85a] revisan la implementation en computadora de la EVOP. 
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Figura 11-40 Un diseno 2 2 para la EVOR 


EJEMPLO 11-5 

Considere un proceso quimico cuyo rendimiento es una funcibn de la temperatura (jq) y la presibn (x 2 ). Las 
condiciones de operacibn actuates sonxj = 250°F yjt 2 = 145 psi. El procedimiento EVOP utiliza el diseno 2 2 
m£s el punto central mostrado en la figura 11-40. El ciclo se completa corriendo cada punto del diseno en 
orden numbrico (1, 2, 3, 4, 5). Los rendimientos del primer ciclo se muestran tambien en la figura 11-40. 

Los rendimientos del primer ciclo se anotan en la hoja de calculo EVOP, la cual se muestra en la ta- 
bla 11-17. A1 tbrmino del primer ciclo no puede hacerse ninguna estimation de la desviacion est£ndar. 


Tabla 11-17 Hoja de c&lculo EVOP para el ejemplo 1 1-5, n = 1 



35 

Ciclo: n - 1 

Respuesta: Rendimiento 

Fase: 1 

Fecha: 1/11/00 




Calculo de la 




desviacibn 



Cdlculo de los promedios 

est&ndar 


Condiciones de operacibn 

(1) 

(2) 

(3) 

(4) 

(5) 


(/) Suma del ciclo anterior 






Suma anterior S = 

(it) Promedio del ciclo anterior 






Promedio anterior 

S = 

(iff) Nuevas observaciones 

84.5 

84.2 

84.9 

84.5 

84.3 

Nueva S = rango x 
f, = 

(iv) Diferencias [(it) - (iii)] 






J5ji 

Rango de (iv)= 

(v) Nuevas sumas [(i) + (iii)] 

84.5 

84.2 

84.9 

84.5 

84.3 

Nueva suma S - 

(vi) Nuevos promedios £y, = (v)/n] 

84.5 

84.2 

84.9 

84.5 

84.3 

Nuevo promedio S = 


Nueva suma S 
n - 1 


Calculo de los efectos 

Efecto de la temperatura = j(y 3 + y 4 -y 2 —y s ) = 0.45 

Efecto de la presion “ i(y 3 + y 5 —y 2 ™y 4 ) " 0.25 
Efecto de la interaccibn T x P = ^ (y 2 + y 3 — y 4 —y 5 ) = 0.15 

Efecto del cambio en la media = |(y 2 + y 3 + y 4 + y 5 - 4y t ) = 0.02 


C&lculo de los lfmites de error 


Para el nuevo promedio = -t=S - 
Vn 


Para los nuevos efectos —j=S — 
v« 


Para el cambio en la media -W S - 
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Tabla 1 1-18 Hoja de cfilculo EVOP para el ejemplo 1 1-5, n — 2 


10 

3 

, 4 

Ciclo: n — 2 

Respuesta: Rendimiento 

Fase: 1 

Fecha: 1/11/00 



C£lculo de los promedios 

C&lculo de la 
desviacidn 
est£ndar 


Condiciones de operacidn 

(1) 

(2) 

(3) 

(4) 

(5) 


(i) Suma del ciclo anterior 

84.5 

84.2 

84.9 

84.5 

84.3 

Suma anterior S = 

(ii) Promedio del ciclo anterior 

84.5 

84.2 

84.9 

84.5 

84.3 

Promedio anterior $ = 

(iii) Nuevas observaciones 

84.9 

84.6 

85.9 

83.5 

84.0 

Nueva S - rango x 
fsji = 0.60 

(iv) Diferencias [(ii) - (iii)] 

-0.4 

-0.4 

-1.0 

+ 1,0 

0.3 

Rango de (iv) = 2.0 

(v) Nuevas sumas [(/) + (iii)] 

169.4 

168.8 

170.8 

168.0 

168.3 

Nueva suma S = 0.60 

(vi) Nuevos promedios [y, = (v)/w] 

84.70 

84.40 

85.40 

84.00 

84.15 

Nuevo promedio S = 


Nueva suma S 


n -1 


C&lculo de los efectos 

Efecto de la temperatura = \(y 3 + y 4 -y 2 -y s ) = 0.43 

Efecto de la presidn = \(y 3 + y s ~y 2 ~Pa) - 0*58 
Efecto de la interaccidn T x P = \{y 2 + y 3 -y 4 -y s ) = 0.83 

Efecto del cambio en la media - i (y 2 + y$ + Pi + y$ — 4^ ) = 
-0.17 


Cdlculo de los limites de error 


Para el nuevo promedio = -j=S = 0.85 


Para los nuevos efectos -j~S - 0.85 


Para el cambio en la media -7=* 5 = 0.76 
Vn 


Los efectos y la interaccidn de la temperatura y la presidn se calculan de la manera usual para un di- 
seno 2 2 . 

Despuds se corre un segundo ciclo y los datos del rendimiento se registran en otra hoja de cdlculo 
EVOP, la cual se muestra en la tabla 11-18. A1 final del segundo ciclo, el error experimental puede esti- 
marse y las estimaciones de los efectos pueden compararse con limites aproximados de 95% (dos desvia- 
ciones est^ndar). Observe que el rango se refiere al rango de las diferencias del rengldn (iv); por lo tanto, 
el rango es +1.0 - (-1.0) = 2.0. Puesto que ninguno de los efectos de la tabla 11-18 excede sus limites de 
error, probablemente el verdadero efecto sea cero, y no se contemplan modificaciones en las condiciones 
de operacidn. 

En la tabla 11-19 se muestran los resultados de un tercer ciclo. Ahora, el efecto de la presidn excede 
su limite de error y el efecto de la temperatura es igual al limite de error. Probablemente ahora se justifi- 
que un cambio en las condiciones de operacidn. 

A la luz de los resultados, parece razonable empezar una nueva fase EVOP alrededor del punto (3). 
Por lo tanto, x 1 = 225°F yr 2 = 150 psi serian el centro del diseno 2 2 en la segunda fase. 

Un aspecto importante de la EVOP es la retroalimentacion de informacidn generada por el proceso 
para operadores y supervisores. Esto se consigue mediante un tablero con informacidn EVOP a la vista 
de todos. En la tabla 11-20 se muestra el tablero de informacidn para este ejemplo al final del ciclo 3, 
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Tabla 1 1-19 Hoja de c£lculo EVOP para el ejemplo 1 1-5, n = 3 



Ciclo: n = 3 

Respuesta: Rendimiento 

Fase: 1 

Fecha: 1/11/00 


C&lculo de los promedios 

C£lculo de la 
desviacidn 
estandar 


Condiciones de operacidn 

(1) 

(2) 

(3) 

(4) 

(5) 


(i) Suma del ciclo anterior 

169.4 

168.8 

170.8 

168.0 

168.3 

Suma anterior S = 0.60 

(ii) Promedio del ciclo anterior 

84.70 

84.40 

85.40 

84.00 

84.15 

Promedio anterior S = 
0.60 

(i Hi ) Nuevas observaciones 

85.0 

84.0 

86.6 

84.9 

85.2 

Nueva S = rango x 
hji — 0*56 

(tv) Diferencias [(«) - («*)] 

-0.30 

+0.40 

-1.20 

-0.90 

-1.05 

Rango de (iv)= 1.60 

(v) Nuevas sumas [(/) + (Hi)] 

254.4 

252.8 

257.4 

252.9 

253.5 

Nueva suma S - 1,16 

(vi) Nuevos promedios (y, - (v)/n] 

84.80 

84.27 

85.80 

84.30 

84,50 

Nuevo promedio S - 


Nueva suma S 

: = 0.58 

n -1 


C&lculo de los efectos 


Efecto de la temperatura = + y 4 -y 2 - y 5 ) - 0.67 

Efecto de la presidn = \(y 3 + y 5 -y 2 -y 4 ) = 0,87 
Efecto de la interaccidn TxP = \(y 2 + y 3 — y 4 —y 5 ) — 

0.64 

Efecto del cambio en la media = \(y 2 + y 3 + y 4 + y $ - 4y, ) = 
-0.07 


Cftlculo de los limites de error 


Para el nuevo promedio = -j=S =0.67 


Para los nuevos efectos —f=S = 0.67 
vrt 


Para el cambio en la media 



= 0.60 


labia 1 1-20 Tablero de informacitfn EVOfJ ciclo 3 
Respuesta: Rendimiento porcentual 

Requerimiento: Maximize 



Lfmites de error para los promedios: ±0.67 


Efectos con 

Temperatura 

0.67 

±0.67 

lfmites de error 

Presidn 

0.87 

±0.67 

de 95%: 

TxP 

0.64 

±0.67 

Desviacidn estdndar 

Cambio en la media 

0.58 

0.07 

±0.60 
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Tabla 11-21 Valores de }\ n 


n — 

2 

3 

4 

5 

6 

7 

s 

9 

10 

il 

0.30 

0.35 

0.37 

0.38 

0.39 

0.40 

0.40 

0.40 

0.41 

9 

0.24 

0.27 

0.29 

0.30 

0,31 

0.31 

0.31 

0.32 

0.32 

10 

0.23 

0.26 

0.28 

0,29 

0.30 

0.30 

0.30 

0.31 

0.31 


La mayoria de las cantidades de la hoja de calculo EVOP se obtienen directamente del an&lisis del di- 
seno factorial 2 k . Por ejemplo, la varianza de cualquier efecto, corao -j(y 3 + y s -y 2 -y 4 ), es simplemente a 1 In, 
donde cr 2 es la varianza de las observaciones (y). Por lo tanto, los limites de error de dos desviaciones es- 
tandar (que corresponden a 95%) para cualquier efecto serf an ±2a/Vn. La varianza del cambio en la me- 
dia es 


F(CIM) = F 


(y*+y 3 +y*+y s -4^) 


1 


= -(5aj+16oj) = 


20 W 2 


25 


Por lo tanto, los limites de error de dos desviaciones estandar para el CIM son ±(2V20/25)er/Vn = 
±1.78o/Vn. 

La desviacion estdndar a se estima por el metodo del rango. Sea quey,(n) denote la observation en el 
punto del diseno i-esimo en el ciclo n, y quey,(n) denote el promedio correspondiente dey,(«) despues de 
n ciclos. Las cantidades del rengldn (iv) de la hoja de c&lculo EVOP son las diferencias y,(n) -y,(n-l). La 
varianza de estas diferencias es 




= a 



n 

(n-1) 


El rango de las diferencias, por ejemplo R D , se relaciona con la estimation de la desviacion estandar de las 
diferencias por d D - Ro/d 2 . El factor d 2 depende del numero de observaciones utilizadas para calcular R D . 
Entonces R[Jd 2 = dVn/(n - 1), por lo que puede usarse 


d 


f(n= 

V 


-1)^ 


= (f k ,n)R D =S 


para estimar la desviacion estandar de las observaciones, donde k denota el numero de puntos que se uti- 
lizaron en el diseno. Para un diseno 2 2 con un punto central se tiene k = 5, y para un diseno 2 3 con un pun- 
to central se tiene k — 9. Los valores de/* „ se dan en la tabla 11-21. 


1 1-7 DISENO ROBUSTO 
11-7.1 Antecedentes 

A lo largo de este libro se ha hecho hincapie en la importancia del uso de experimentos disenados estadis- 
ticamente en el proyecto, desarrollo y mejoramiento de productos y procesos. A partir de la decada de 
1980, los ingenieros y cientificos han adquirido la conciencia creciente de los beneficios del uso de experi- 
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mentos disenados y, en consecuencia, ha habido muchas areas de aplicaciones nuevas. Una de las mas im- 
portantes de 6stas es el diseno robusto, donde la atencidn se centra en uno o mas de los siguientes puntos: 

1. El diseno de sistemas (productos o procesos) que no sean sensibles a factores ambientales que 
puedan afectar el desempeno una vez que el sistema se ha desplegado en el campo. Un ejemplo 
es la formulacidn de una pintura para exteriores que debe tener gran duracidn cuando se expo- 
nga a una variedad de condiciones clim&tieas, Puesto que las condiciones clim&ticas no son del 
todo predecibles, y ciertamente no son constantes, el responsable de la formulacidn del producto 
quiere que 6ste sea robusto contra un amplio rango de factores de temperatura, humedad y pre- 
cipitation pluvial que afectan el desgaste y acabado de la pintura. 

2. El diseno de productos para que no sean sensibles a la variabilidad transmitida por los compo- 
nentes del sistema. Un ejemplo es el diseno de un amplificador electronico para que el voltaje de 
salida este tan cerca como sea posible del valor nominal deseado, independientemente de la va- 
riabilidad de los parametros eldctricos de los resistores, transistores y fuentes de poder que son 
los componentes del aparato. 

3. El diseno de procesos para que el producto manufacturado este tan cerca como sea posible de las 
especificaciones nominates, aun cuando sea imposible controlar con toda precision algunas va- 
riables del proceso (como la temperatura) o las caracteristicas de las materias primas. 

4 . Determinar las condiciones de operation de un proceso para que las caracteristicas crfticas del 
producto estdn tan cerca como sea posible del valor objetivo deseado y la variabilidad en torno a 
este objetivo se minimice. Ejemplos de este tipo de problema ocurren con frecuencia, Uno de 
ellos sucede en la manufactura de semiconductores, donde seria deseable que el espesor del 6xi- 
do de una oblea estuviera lo m<is cerca posible del espesor objetivo promedio, asi como que la va- 
riabilidad del espesor a lo largo de la oblea (una medida de uniformidad) fuese lo m&s pequena 
posible. 

A principios de la decada de 1980, el ingeniero japones Genichi Thguchi introdujo un enfoque para 
resolver problemas de este tipo, a los que se hace referenda de manera conjunta como el problema del di- 
seno param£trico robusto (RPD, por sus siglas en ingles) (ver Taguchi y Wu [109] y Ihguchi [108a, b]). Su 
enfoque se baso en la clasificacion de las variables de un proceso o producto como variables de control (o 
controlables) y variables de niido (o no controlables) para despues encontrar los ajustes de las variables 
controlables que minimizan la variabilidad transmitida a la respuesta por las variables no controlables. Se 
establece el supuesto de que aun cuando los factores de ruido no son controlables en el sistema a gran es- 
cala, pueden controlarse para los fines de un experimento. Referirse a la figura 1-1 para una ilustracion 
gr&fica de las variables controlables y no controlables en el contexto general de un experimento disenado. 

Thguchi introdujo algunos ntetodos estadisticos novedosos y ciertas variantes de las t6cnicas estable- 
cidas como parte de este procedimiento RPD, Hizo uso de disehos factoriales altamente fraccionados y 
otros tipos de disenos fraccionados obtenidos a partir de arreglos ortogonales. Su metodologia generd 
multiples debates y controversias. Parte de la polemica surgid porque la metodologia de Taguchi fue de- 
fendida en Occidente inicialmente (y principalmente) por empresarios, y la ciencia estadistica subyacente 
no habia sido revisada adecuadamente por los especialistas. Para finales de la ddcada de 1980, los resulta- 
dos de una revisidn muy completa indicaron que aun cuando los conceptos de ingenierfa de Thguchi y el 
objetivo global del RPD tenian bases solidas, habia problemas de fondo con esta estrategia experimental 
y con los metodos para el analisis de datos, Para detalles especfficos de estos temas, ver Box [12d], Box, 
Bisgaard y Fung [14], Hunter [59a, b], Montgomery [80b], Myers y Montgomery [85a] y Pignatiello y 
Ramberg [94]. Muchas de estas preocupaciones se encuentran resumidas tambien en el amplio panel de 
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discusiOn publicado en Technometrics (ver Nair, et al. [86]). En el material suplementario del texto de este 
capftulo tambiOn se comentan e ilustran muchos de los problemas implicitos en los metodos tecnicos de 
Taguchi. 

La metodologfa de Thguchi para el problema RPD gira en torno al uso de un diseno ortogonal para 
los factores controlables, el cual se “cruza” con un diseno ortogonal separado para los factores de ruido. 
En la tabla 11-22 se presenta un ejemplo de Byrne y Taguchi [23] que trata del desarrollo de un metodo 
para ensamblar un conector elastomOtrico en un tubo de nylon que produciria la fuerza de separation re- 
querida. Hay cuatro factores controlables, cada uno con tres niveles (A = interferencia, B — espesor de la 
pared del conector, C = profundidad de insertion yD = porcentaje de adhesivo), y tres factores de ruido 
o no controlables ( E = tiempo de acondicionamiento, F = temperatura de acondicionamiento y G - hu- 
medad relativa del acondicionamiento). El panel a de la tabla 11-22 contiene el diseno para los factores 
controlables. Observe que se trata de un diseno factorial fraccionado de tres niveles; especificamente, es 
un diseno 3 4 2 . Taguchi lo llama el diseno de arreglo interior. El panel b de la tabla 11-22 contiene un dise- 
no 2 3 para los factores de ruido, al que Thguchi llama el diseno de arreglo exterior. Entonces se realiza 
cada corrida del arreglo interior para todas las combinaciones de tratamientos del arreglo exterior, pro- 
duciendose las 72 observaciones de la fuerza de separation que se muestran en la tabla. A este tipo de di- 
seno se le llama diseno de arreglo cruzado. 

Thguchi sugiriO que los datos de un experimento de arreglo cruzado se resumieran con dos estadfs- 
ticos: el promedio de cada observation en el arreglo interior para todas las corridas del arreglo exterior 
y un resumen de estadisticas que intentaba combinar information acerca de la media y la varianza, 11a- 
mado relacidn senal a ruido. Las relaciones senal a ruido se definen a propOsito para que un valor m&xi- 
mo de la relation minimice la variabilidad transmitida por las variables de ruido. Entonces se lleva a 
cabo un an&lisis para determinar cuales son los ajustes de los factores controlables que dan como resul- 
tado 1) una media tan prdxima como sea posible al objetivo deseado y 2) un valor mhximo de la relacidn 
senal a ruido. 

El examen de la tabla 11-22 revela un problema importante con la estrategia de diseno de Thguchi; a 
saber, el enfoque del arreglo cruzado llevarh a un experimento muy grande. En el ejemplo tratado aqui 
sdlo hay siete factores, pero el diseno tiene 72 corridas. Ademas, el diseno de arreglo intemo es un diseno 
3 4 2 de resolution III (ver el capftulo 9 para un estudio de este diseno), por lo que a pesar del gran numero 
de corridas, no es posible obtener ninguna information acerca de las interacciones entre las variables con- 
trolables. De hecho, incluso la information acerca de los efectos principals esta potencialmente corrom- 
pida, ya que los efectos principals tienen estrechas relaciones de alias con las interacciones de dos 
factores. Ocurre tambien que las relaciones senal a ruido de Thguchi son problemhticas; al maximizarse la 
relacidn no se minimiza necesariamente la variabilidad. Referirse al material complementary del texto 
para mayores detalles. 

Un punto importante acerca del diseno de arreglo cruzado es que si proporciona information acerca 
de las interacciones factor controlable x factor de ruido. Estas interacciones son crutiales para la solu- 
cidn de un problema RPD. Por ejemplo, considere las graficas de las interacciones de dos factores de la fi- 
gura 11-41, donde x es el factor controlable y z el factor de ruido. En la figura 11-4 la no hay ninguna 
interaction* x z; por lo tanto, no hay ningun valor de la variable controlable* que afecte la variabilidad 
transmitida a la respuesta por la variabilidad enz. Sin embargo, en la figura 11-416 hay una fuerte interac- 
tion* x z. Observe que cuandox se pone en el nivel bajo, hay mucho menos variabilidad en la variable de 
respuesta que cuando* esth en el nivel alto. Por lo tanto, a menos que haya como mlnimo una interaction 
factor controlable x factor de ruido, no hay ningun problema de diseno robusto. Como se vera en la si- 
guiente section, enfocarse en la identification y el modelado de estas interacciones es una de las claves de 
un enfoque m&s efitiente y eficaz del RPD. 
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Figura 11-41 El papel de la interaccidn control X ruido en un diseno robusto. 


1 1-7.2 El enfoque de la superficie de respuesta para el diseno robusto 

Como se senal6 en la secci6n anterior, las interacciones entre los factores controlables y los de ruido son 
la clave en un problema de diseno robusto. Por lo tanto, es logico usar un modelo de respuesta que incluya 
tanto a los factores controlables como a los factores de ruido y sus interacciones. Para ilustrar, suponga 
que se tienen dos factores controlables^ y x 2 y un solo factor de ruido z v Se supone que tanto los factores 
controlables como el de ruido se expresan como las variables codificadas usuales (es decir, tienen su cen- 
tro en cero y tienen limites inferior y superior ±a). Si quiere considerarse un modelo de primer orden que 
incluya las variables controlables, un modelo logico es 

y~ Po + Pl X l ^ r ^2 X 2 + Pn X l X 2 ^^U X 1 Z 1 ^^21 X 2 Z 1 +£ (11-28) 

Observe que este modelo incluye los efectos principales de ambos factores controlables, su interaction, el 
efecto principal de la variable de ruido y las dos interacciones entre las variables controlables y la de rui- 
do. A este tipo de modelo, el cual incorpora a las variables controlables y las de ruido, suele llamarsele 
modelo de respuesta o de reaction. Excepto cuando al menos uno de los coeficientes de regresion <5 u y d 2l 
sea diferente de cero, no habra ningun problema de diseno robusto. 

Una ventaja importante del enfoque del modelo de respuesta es que tanto los factores controlables 
como los factores de ruido pueden colocarse en un solo diseno experimental; es decir, puede evitarse la 
estructura de los arreglos interior y exterior del enfoque de Taguchi. Al diseno que contiene tanto los fac- 
tores controlables como los de ruido suele llamarsele diseno de arreglo combinado. 

Como se senald anterionnente, se supone que las variables de ruido son aleatorias, aun cuando son 
controlables para los fines de un experimento. Especificamente, se supone que las variables de ruido es- 
tan expresadas en unidades codificadas, que tienen valor esperado cero, varianza a\, y que si hay varias 
variables de ruido, tienen covarianzas cero. Bajo estos supuestos es sencillo encontrar un modelo para la 
respuesta media tomando el valor esperado de y en la ecuacidn 11-28. Se obtiene asi 

E z (y)— Pq + fil X l~y ft2 x 2 +Pv2 X l X 2 

donde el subindicez del operador expectativa es un recordatorio para tomar el valor esperado con respec- 
to a ambas variables aleatorias de la ecuacion 11-28, z x ye. Para encontrar un modelo de la varianza de la 
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respuestay se usa el enfoque de la transmision del error. Primero, el modelo de respuesta de la ecuacion 
11-28 se expande en una serie de Taylor de primer orden alrededor de z t = 0. Se obtiene asi 

■ > ' S> ' 2=a+ ^' (Zl_0)+jR+£ 

= Pa ~^~0l X l ^ 02 X 2 + Pl2 X l X 2 
+ (y i +^21 X 2 ) Z 1 +R + £ 

donde R es el t6rmino del residuo de la serie de Tkylor. Como es comun en la practica, se ignorar& el ter- 
mino del residuo. Ahora puede obtenerse la varianza dey aplicando el operador varianza en esta ultima 
expresidn (sin R). El modelo para la varianza result ante es 

V z{.y) = o 2 z {y, + <$, 1*1 + <$ 21*2 ) 2 +o 2 

De nueva cuenta se ha usado el sublndice z en el operador varianza como recordatorio de que tanto z x 
como e son variables aleatorias. 

Se han derivado modelos simples para la media y la varianza de la variable de respuesta de interns. 
Observe lo siguiente: 

1. Los modelos de la media y la varianza incluyen unicamente las variables controlables. Esto signi- 
fica que es potencialmente posible fijar las variables controlables para alcanzar un valor objetivo 
de la media y minimizar la variabilidad transmitida por la variable de ruido. 

2. Aun cuando en el modelo de la varianza intervienen s61o las variables controlables, incluye asi- 
mismo los coeficientes de regresion de la interaccion entre las variables controlables y la de ruido. 
Es asi como la variable de ruido influye en la respuesta. 

3. El modelo de la varianza es una funcidn cuadr£tica de las variables controlables. 

4. El modelo de la varianza (dejando de lado o 2 ) es solo el cuadrado de la pendiente del modelo de 
respuesta ajustado en la direction de la variable de ruido. 

Para dar un uso operacional a estos modelos seria necesario: 

1. Realizar un experimento y ajustar un modelo de respuesta apropiado, tal como la ecuacidn 
11-28. 

2. Sustituir los coeficientes de regresi6n desconocidos en los modelos de la media y la varianza con 
sus estimaciones de minimos cuadrados del modelo de la respuesta o de reaction, y sustituir la cr 
del modelo de la varianza con el cuadrado medio de los residuales que se encontro cuando se 
ajustd el modelo de respuesta. 

3. Optimizar los modelos de la media y la varianza utilizando los metodos estandares de optimiza- 
cion de respuestas multiples revisadas en la seccidn 11-3.4. 

Es muy sencillo generalizar estos resultados. Suponga que hay k variables controlables y r variables de 
ruido. El modelo de respuesta general que incluye estas variables se escribira como 

y(x, z)=f(x)+h(x, z)+s (11-29) 

donde /(x) es la porcidn del modelo que incluye s61o las variables controlables y h(\, z) son los terminos 
que incluyen los efectos principales de los factores de ruido y las interacciones entre los factores controla- 
bles y los de ruido. De manera tipica, la estructura de h(x, z) es 
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r k r 

K* z )=2 y. 2 .+22 d t x t z j 


>=i j - i 


La estructura de/(x) depended de cu&l sea el tipo de modelo que el experimentador considere apropiado 
para las variables controlables. Las elecciones logicas son el modelo de primer orden con interaction y el 
modelo de segundo orden. Si se supone que las variables de ruido tienen media cero, varianza a\ y cova- 
rianzas cero, y que las variables de ruido y los errores aleatorios e tienen covarianzas cero, entonces el mo- 
delo de la media para la respuesta es 

E,[y(x,z)]=f(x) (11-30) 


y el modelo de la varianza para la respuesta es 

KM* z)]=<7 2 £ 

1=1 


z) 


+o 2 


(11-31) 


Myers y Montgomery [85a] presentan una forma un tanto mds general de la ecuaciOn 11-31 basada en la 
aplicaciOn directa de im' operador de varianza condicional al modelo de respuesta. 


EJEMPLO 1 1-6 

Para ilustrar el procedimiento anterior, considere nuevamente el ejemplo 6-2 en el que se estudiaron cua- 
tro factores en un diseno factorial 2 4 para investigar su efecto sobre la rapidez de filtration de un producto 
qufmico. Se supondrd que el factor^, la temperatura, es dificil de controlar en el proceso a gran escala, 
pero que puede controlarse durante el experimento (el cual se llevo a cabo en una planta piloto). Los 
otros tres factores, la presion (B), la concentracion (C) y la velocidad de agitaciOn (D), son faciles de con- 
trolar. Por lo tanto, el factor de ruido Zj es la temperatura, y las variables controlables*!,;^ yx 3 son la pre- 
siOn, la concentraci6n y la velocidad de agitaciOn, respectivamente. Puesto que tanto los factores 
controlables como el factor de ruido estan en el mismo diseno, el diseno factorial 2 4 utilizado en este ex- 
perimento es un ejemplo de un disefio de arreglo combinado. 

Utilizando los resultados del ejemplo 6-2, el modelo de respuesta es 



« 70.06 +10.81Z! +4.94x 2 +7.31x 3 - 9.06x a Z! + 8.31x 3 Z! 

Utilizando las ecuaciones ll-30y 11-31, se encuentra que los modelos de la media y la varianza son 

E z [X^ z l )]=70.06+4.94x 2 +7.3 1 x 3 

y 

V 2 [y(x, Zj)]* (7 2 (10.81-9.06x 2 +8.31 x 3 ) 2 +<7 2 

= o] (116.91 +82.08x1 +69.06x 2 -195.88 x 2 
+179.66x3 -150.5&t 2 x 3 )+a 2 

respectivamente. Suponga ahora que los niveles bajo y alto de la variable de ruido, temperatura, se corrie- 
ron a una desviaciOn estfindar a ambos lados de su valor tipico 0 promedio, de tal modo que a\ = l,y que 
se usad 2 = 19.51 (6ste es el cuadrado medio de los residuales obtenido al ajustar el modelo de respuesta). 
Por lo tanto, el modelo de la varianza queda como 

V z [y(x, z 2 )]= 136.42-195.88x 2 +179.66x 3 -150.58x 2 * 3 +82.08* 2 +69.06* 2 
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Figure 11-42 Contomos del indice de filtracidn medio constante, ejemplo 11-6, 
con x l ~ temperatura = 0. 


En la figure 11-42 se presenta la grdfica de contorno del paquete de software Design-Expert de los 
contomos de respuesta del modelo de la media. Para constmir esta grafica se fijo el factor de mido (tem- 
peratura) en cero y el factor controlable no significativo (presibn) tambibn en cero. Observe que la rapi- 
dez de filtracibn promedio se incrementa cuando tanto la concentracibn como la velocidad de agitacibn 
se incrementan. Design-Expert constituird tambibn de manera automatica gr&ficas de la ralz cuadrada de 
los contomos de la varianza, que denomina propagacibn del error (o POE, por sus siglas en ingibs). Evi- 
dentemente, la POE no es sino la desviacion estandar de la variabilidad que se transmite a la respuesta 
como una funcibn de las variables controlables. En la figure 11-43 se muestra la gr&fica de contorno y la 
grdfica de superficie de respuesta tridimensional de la POE, obtenida con Design-Expert (en esta gr&fica 
la variable de ruido se mantiene constante en cero, como se explico anteriormente). 

Suponga que el experimentador quiere mantener una rapidez de filtracibn promedio de cerca de 75 y 
minimizar la variabilidad alrededor de este valor. En la figure 1 1-44 se muestra una grdfica de superposi- 
ci6n de los contomos de la rapidez de filtracibn media y la POE como una funcion de la concentracibn y la 
velocidad de agitacibn, las variables controlables significativas. Para conseguir los objetivos deseados ser£ 
necesario mantener la concentracibn en el nivel alto y la velocidad de agitacibn muy cerca del nivel inter- 
medio. 


El ejemplo 11-6 ilustra el uso de un modelo de primer orden con interaccibn como el modelo para los 
factores controlables, /(x). Se presenta ahora un ejemplo adaptado de Montgomery [80b] que incluye un 
modelo de segundo orden. 
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Figure 11-44 Gr£fica de superposicidn de los contomos de la media y la POE del 
fndice de filtration, ejemplo 11-6, con x, = temperature = 0. 


ejemplo 11-7 

En una fabrica de semiconductores se realizo un experimento que incluyo dos variables controlables y tres 
variables de ruido. En la tabla 11-23 se muestra el diseno de arreglo combinado utilizado por los experimen- 
tadores. El diseno es una variante de 23 corridas de un diseno central compuesto que se cre6 empezando 
con un DCC estandar para cinco factores (la porcion del cubo es un diseno 2 5 “ 1 ) y eliminando las corridas 
axiales asociadas con las tres variables de ruido. Este diseno soportara un modelo de respuesta que tiene un 
modelo de segundo orden en las variables controlables, los efectos principals de las tres variables de ruido 
y las interacriones entre los factores controlables y los de ruido. El modelo de respuesta ajustado es 
%x, z)= 30.37- 2. 92xj - 4.13x 2 + 2.60* 2 +2.18x 2 2 +187x l x 2 

+ 2.73 Zj - 2.33 z 2 +2.33z 3 - 0.27x 1 z 1 + 0.89^2 + 2.5 &CjZ 3 
+ 2.01x 2 z 1 — 1.43x 2 z 2 +1.56 x 2 z 3 
Los modelos de la media y la varianza son 

E z [y(x, z)]= 30.37- 2.92x, - 4.13x 2 +2.60 x, 2 +Z18x 2 2 +2.81 Xi x 2 

y 

V z [y(x, z)]= 19.26+3.20;^ +12.45x, + 1.52x1 +8.52x 2 + 2.21v,.v 2 


donde se han sustituido las estimaciones de los par&metros del modelo de respuesta ajustado en las ecua- 
ciones de los modelos de la media y la varianza y, como en el ejemplo anterior, se supone que a\ = 1. En 
las figuras 11-45 y 11-46 se presentan las gr£ficas (de Design-Expert ) de contorno de la media y la POE del 
proceso (recuerde que la POE es la ratz cuadrada de la varianza de la superficie de respuesta) generadas a 
partir de estos modelos. 
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Tabla 1 1-23 Experimento de arreglo combinado con dos variables controlables y tres variables de ruido, ejemplo 11-7 


Numero de corrida 

*i 

*2 

*1 

*2 

*3 

y 

1 

-1.00 

-1.00 

-1,00 

-1.00 

LOO 

44.2 

2 

1.00 

-1.00 

-1.00 

-1.00 

-1.00 

30.0 

3 

-1.00 

1.00 

-1.00 

-1.00 

-1.00 

30.0 

4 

1.00 

1.00 

-1.00 

-1.00 

1.00 

35.4 

5 

-1.00 

-1.00 

1.00 

-1.00 

-1.00 

49.8 

6 

1.00 

-1.00 

1.00 

-1.00 

1.00 

36.3 

7 

-1.00 

1.00 

1.00 

-1.00 

1.00 

41.3 

8 

1.00 

1.00 

1.00 

-1.00 

-1.00 

31.4 

9 

-1.00 

-1.00 

-1.00 

1.00 

-1.00 

43.5 

10 

1.00 

-1.00 

-1.00 

1.00 

LOO 

36.1 

11 

-1.00 

1.00 

-1,00 

1.00 

LOO 

22.7 

12 

1.00 

1.00 

-1,00 

LOO 

-1.00 

16.0 

13 

-1,00 

-1.00 

1.00 

LOO 

LOO 

43.2 

14 

1.00 

-1.00 

1.00 

1.00 

-LOO 

30.3 

15 

-1.00 

1.00 

1.00 

1.00 

-1.00 

30.1 

16 

1.00 

1.00 

1.00 

1.00 

LOO 

39.2 

17 

-2.00 

0.00 

0.00 

0.00 

0.00 

46.1 

18 

2.00 

0.00 

0.00 

0.00 

0,00 

36.1 

19 

0.00 

-2.00 

0.00 

0.00 

0.00 

47.4 

20 

0.00 

2.00 

0.00 

0.00 

0.00 

31.5 

21 

0.00 

0.00 

0.00 

0,00 

0.00 

30.8 

22 

0.00 

0.00 

0,00 

0.00 

0.00 

30.7 

23 

0.00 

0.00 

0.00 

0.00 

0.00 

31.0 
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En este problema es deseable mantener la media del proceso abajo de 30* A1 inspeccionar las figuras 
11-45 y 11-46, es claro que se necesitar& hacer un ajuste si se quiere hacer pequena la varianza del proce- 
so. Puesto que sdlo hay dos variables controlables, una forma lbgica de llegar a este arreglo es superponer 
los contornos de la respuesta media constante y la varianza constante, como se muestra en la figura 11-47. 
Esta grafica muestra los contornos para los que la media del proceso es menor o igual que 30 y la desvia- 
cion estandar del proceso es menor o igual que 5. La region delimitada por estos contornos representaria 
una zona de operacibn tipica de respuesta media baja y varianza del proceso baja. 


11-8 PROBLEMAS 

11-1. En una planta qufmica se produce oxfgeno licuando aire y separdndolo por destilacibn fraccionada en sus ga- 
ses componeotes. La pureza del oxigeno es una funcibn de la temperatura del condensador principal y de la 
relation de lapresion entre las columnas superior e inferior. Las condiciones de operacibn actuales son tem- 
peratura (£,) = -220°C y la relacibn de la presion (| 2 ) = 1.2. Utilizando los datos siguientes, encontrar la tra- 
yectoria del ascenso m£s pronunciado: 


Temperatura (^) indice de la presibn (g 2 ) Pureza 


-225 

1.1 

82.8 

-225 

1.3 

83.5 

-215 

1.1 

84.7 

-215 

1.3 

85.0 

-220 

1.2 

84.1 

-220 

1.2 

84.5 

-220 

1.2 

83.9 

-220 

1.2 

84.3 


11-2. Un ingeniero industrial ha desarrollado un modelo de simulacibn por computadora para un sistema de in- 
ventario de dos articulos. Las variables de decisibn son la cantidad del pedido y el punto de reorden de cada 
articulo. La respuesta que debe minimizarse es el costo total del inventario, El modelo de simulation se usa 
para producir los datos que se muestran en la tabla siguiente. Identificar el diseno experimental. Encontrar 
la trayectoria del descenso m&s pronunciado. 


Articulo 1 Articulo 2 


Cantidad del 
pedido (li) 

Punto de 
reorden (£ 2 ) 

Cantidad del 
pedido (| 3 ) 

Punto de 
reorden (£ 4 ) 

Costo 

total 


25 

250 

40 

625 


45 

250 

40 

670 


25 

300 

40 

663 


25 

250 

80 

654 


45 

300 

40 

648 


45 

250 

80 

634 

100 

25 

300 

80 

692 


45 

300 

80 

686 


35 

275 

- 60 

680 

120 

35 

275 

60 

674 


35 

275 

60 

681 
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11-3. Verificar que el siguiente diseno es simplex. Ajustar el modelo de primer orden y encontrar la trayectoria del 
ascenso mds pronunciado. 


*1 

x 2 

*3 

y 

0 

42 

-1 

18.5 

-42 

0 

1 

19*8 

0 

-V2 

-1 

17.4 

42 

0 

1 

22.5 


11-4. Para el modelo de primer orden 


y = 60+1.5^ - 0.&r 2 + 2.0 jc 3 

encontrar la trayectoria del ascenso mds pronunciado* Las variables estdn codificadas como -1 <*,- < 1. 

11-5. La regidn de experimentation de tres factores son el tiempo (40 < 7\ < 80 min), la temperatura (200 < T 2 < 
300°C) y la presidn (20 < P < 50 psig). Se ha ajustado un modelo de primer orden en variables codificadas a 
los datos del rendimiento de un diseno 2 3 . El modelo es 

y- 30 + 5^ + 2.5jc 2 + 3*5jc 3 

6E1 punto T y - 85, T 2 = 325, P = 60 estd en la trayectoria del ascenso mds pronunciado? 

11-6. La regidn de experimentacidn de dos factores son la temperatura (100 < T < 300°F) y la velocidad de ali- 
mentacidn del catalizador (10 < C < 30 lb/pulg). Un modelo de primer orden con las variables codificadas 
usuales ±1 se ha ajustado a la respuesta peso molecular, obtenidndose el modelo siguiente: 

y= 2000+125^ + 40x 2 

a) Encontrar la trayectoria del ascenso mds pronunciado. 

b ) Se desea mover a una regidn donde los pesos moleculares rebasen 2500. Con base en la informacidn que 
se tiene por la experimentacidn en esta regidn, 6aproximadamente cudntos pasos en la trayectoria del as- 
censo mds pronunciado se necesitan para moverse a la regidn de interns? 

11-7. La trayectoria del ascenso mds pronunciado suele calculate suponiendo que el modelo es en realidad de pri- 
mer orden; es decir, que no hay interaccidn. Sin embargo, incluso si hay interaccidn, el ascenso mds pronun- 
ciado que se determina ignorando la interaccidn seguird produciendo por lo general buenos resultados. Para 
ilustrar, suponga que se ha ajustado el modelo 

y= 20 + 5xj - 8 jc 2 + 3x x x 2 


utilizando variables codificadas (-1 < Jt ■ < +1). 

a) Tlazar la trayectoria del ascenso mds pronunciado que se obtendrfa si se ignorara la interaccidn. 

b) Tfazar la trayectoria del ascenso mds pronunciado que se obtendrfa incluyendo la interaccidn en el mo- 
delo. Compararla con la trayectoria que se encontrd en el inciso a. 

11-8. Los datos que se muestran en la siguiente tabla se recolectaron en un experimento para optimizar el creci- 
miento de un cristal como una funcidn de tres variables x Xi x 2 yx 3 . Son deseables los valores grandes dey (ren- 
dimiento en gramos). Ajustar un modelo de segundo orden y analizar la superficie ajustada. 6Bajo qu 6 
conjunto de condiciones se alcanza el crecimiento maximo? 
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*1 

*2 

*3 

y 

- 1 

-1 

-1 

66 

-1 

-1 

1 

70 

-1 

1 

-1 

78 

-1 

1 

1 

60 

1 

-1 

-1 

80 

1 

-1 

1 

70 

1 

1 

-1 

100 

1 

1 

1 

75 

-1.682 

0 

0 

100 

1.682 

0 

0 

80 

0 

-L682 

0 

68 

0 

1.682 

0 

63 

0 

0 

-1.682 

65 

0 

0 

1.682 

82 

0 

0 

0 

113 

0 

0 

0 

100 

0 

0 

0 

118 

0 

0 

0 

88 

0 

0 

0 

100 

0 

0 

0 

85 


11-9. Un ingeniero qufmico recolect6 los siguientes datos. La respuestay es el tiempo de filtracidn,*! es la tempe- 
ratura y x 2 es la presidn. Ajustar un modelo de segundo orden. 



*2 

y 

-1 

-1 

54 

-1 

1 

45 

1 

-1 

32 

1 

1 

47 

-1.414 

0 

50 

1.414 

0 

53 

0 

-1.414 

47 

0 

1.414 

51 

0 

0 

41 

0 

0 

39 

0 

0 

44 

0 

0 

42 

0 

0 

40 


a) LQu6 condiciones de operacidn se recomendarfan si el objetivo es minimizar el tiempo de filtracidn? 

b) 6Qu£ condiciones de operacidn se recomendarian si el objetivo es operar el proceso con una velocidad 
de filtracidn media muy prdxima a 46? 

1 MO. El diseno hexagonal que se presenta a continuacidn se usa en un experimento que tiene como objetivo ajus- 
tar un modelo de segundo orden: 
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*1 

*2 

y 

1 

0 

68 

0.5 

V 075 

74 

-0.5 

V075 

65 

-1 

0 

60 

-0.5 

-V075 

63 

0.5 

»V0^5 

70 

0 

0 

58 

0 

0 

60 

0 

0 

57 

0 

0 

55 

0 

0 

69 


a) Ajustar el modelo de segundo orden. 

b) Efectuar el andlisis candnico, LQu6 tipo de superficie se ha encontrado? 

c) LQu6 condiciones de operacidn para y x 2 llevan al punto estacionario? 

d) tDdnde se correria este proceso si el objetivo es obtener una respuesta que estd tan cerca de 65 como sea 
posible? 

11-11. Un experimentador corrid un diseno de Box-Behnken y obtuvo los siguientes resultados, donde la variable 
de respuesta es la viscosidad de un polfmero: 


Nivel 

Tfemperatura 

Velocidad de 
agitacidn 

Preston 

*1 

*2 

*3 

Alto 

200 

10.0 

25 

+ 1 

+ 1 

+ 1 

Intermedio 

175 

7.5 

20 

0 

0 

0 

Bajo 

150 

5.0 

15 

-1 

-1 

-1 


Corrida 


*2 

*3 

y\. 

1 

-1 

-1 

0 

535 

2 

+ 1 

-1 

0 

580 

3 

-1 

+1 

0 

596 

4 

+1 

+1 

0 

563 

5 

-1 

0 

-1 

645 

6 

+1 

0 

-1 

458 

7 

-1 

0 

+1 

350 

8 

+ 1 

0 

+1 

600 

9 

0 

-1 

-1 

595 

10 

0 

+1 

~1 

648 

11 

0 

-1 

+1 

532 

12 

0 

+1 

+1 

656 

13 

0 

0 

0 

653 

14 

0 

0 

0 

599 

15 

0 

0 

0 

620 


a) Ajustar el modelo de segundo orden. 

b) Efectuar el andlisis candnico. LQ\x6 tipo de superficie se ha encontrado? 
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c) 6Qu e condiciones de operacidn para x x 2 y x 3 llevan al punto estacionario? 

d) <LQue condiciones de operacidn se recomendarian si es importante obtener una viscosidad que est6 tan 
cerca de 600 como sea posible? 

11-12. Considere el diseno central compuesto de tres variables que se muestra a continuacidn. Analizar los datos y 
sacar conclusions, suponiendo que se quiere maximizar la conversidn (y x ) con la actividad (y 2 ) entre 55 y 60. 


Corrida 

Tiempo 

(min) 

Tbmperatura 

(°C) 

Catalizador 

(%) 

Conversion 
(%) 
y i 

Actividad 

yi 

1 

- 1.000 

- 1.000 

- 1.000 

74.00 

53.20 

2 

1.000 

-1,000 

- 1.000 

51.00 

62.90 

3 

- 1.000 

1.000 

- 1.000 

88.00 

53.40 

4 

1.000 

1.000 

- 1.000 

70,00 

62.60 

5 

- 1.000 

- 1.000 

1.000 

71.00 

57.30 

6 

1.000 

- 1.000 

1.000 

90,00 

67.90 

7 

- 1.000 

1.000 

1.000 

66.00 

59,80 

8 

1.000 

1.000 

1.000 

97.00 

67.80 

9 

0.000 

0.000 

0.000 

81.00 

59.20 

10 

0.000 

0,000 

0.000 

75.00 

60.40 

11 

0.000 

0.000 

0.000 

76.00 

59.10 

12 

0.000 

0.000 

0.000 

83.00 

60.60 

13 

-1.682 

0.000 

0.000 

76.00 

59.10 

14 

1.682 

0.000 

0.000 

79.00 

65.90 

15 

0,000 

-1.682 

0.000 

85.00 

60.00 

16 

0.000 

1.682 

0.000 

97.00 

60.70 

17 

0.000 

0.000 

-1.682 

55.00 

57.40 

18 

0.000 

0,000 

1.682 

81.00 

63,20 

19 

0.000 

0.000 

0,000 

80.00 

60.80 

20 

0.000 

0.000 

0.000 

91,00 

58.90 


11-13. Un fabricante de herramientas de corte ha desarrollado dos ecuaciones empiricas para la vida de la herra- 
mienta en horas (y^ y para el costo de la herramienta en ddlares (y 2 )- Anibos modelos son funciones lineales 
de la dureza del acero (jq) y de la fecha de fabricacidn (x 2 ). Las dos ecuaciones son 

= lO-l-Sxj +2 x 2 
y 2 =23+3x 1 +4x 2 


y ambas ecuaciones son validas en el rango -1.5 < < 1.5. El costo unitario de la herramienta debe estar aba- 

jo de $27.50 y la vida debe exceder 12 horas para que el producto sea competitivo. ^Existe algun conjunto de 
condiciones de operacidn factible para este proceso? 6D6nde se recomendaria correr este proceso? 

11-14. Se corre un diseno central compuesto en un proceso de deposicion quimica por vapor y se obtienen los datos 
experimentales que se muestran a continuacidn. Se procesaron simuMneamente cuatro unidades experi- 
mentales en cada corrida del diseno, y las respuestas son la media y la varianza del espesor, calculadas en las 
cuatro unidades. 
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*1 

*2 

y 

s 2 

-1 

-1 

360.6 

6.689 

1 

-1 

445.2 

14.230 

-1 

1 

412.1 

7.088 

1 

1 

601.7 

8.586 

1.414 

0 

518.0 

13.130 

-1.414 

0 

411.4 

6.644 

0 

1.414 

497,6 

7.649 

0 

-1.414 

397.6 

11.740 

0 

0 

530.6 

7.836 

0 

0 

495.4 

9.306 

0 

0 

510.2 

7.956 

0 

0 

487,3 

9.127 


a) Ajustar un modelo a la respuesta media. Analizar los residuales. 

b) Ajustar un modelo a la respuesta varianza. Analizar los residuales. 

c) Ajustar un modelo a In (s 2 ). LEste modelo es superior al que se encontrd en el inciso bl 

d) Suponga que se quiere que el espesor medio est£ en el intervalo 450 ± 25 . Encontrar un conjunto de con- 
diciones de operacidn que consiga este objetivo y que al mismo tiempo minimice la varianza. 

e) Comentar los aspectos de la minimizacidn de la varianza del inciso d. £Se ha minimizado tambidn la va- 
rianza total del proceso? 

11-15. Verificar que el diseno de primer orden ortogonal es tambidn un diseno de primer orden rot able. 
11-16. Demostrar que aumentar un diseno 2 k con n c puntos centrales no afecta las estimaciones de /?, (i = 1, 2, ..., k), 
pero que la estimacidn de la ordenada al origen es el promedio de las 2 k + n c observaciones. 

11-17. El diseno central compuesto ratable . Puede demostrarse que un diseno de segundo orden es rotable si 
5£ =1 x L xb ju ~ 0 si a o b (o ambas) son impares y si = 32"_ 1 x^ u . Demostrar que para el disefto central 

compuesto estas condiciones llevan a a = (n f y /A para la rotabilidad, donde n F es el numero de puntos en la 
porcidn factorial. 

11-18, Verificar que el diseno central compuesto que se muestra abajo est£ separado en bloques ortogonales: 



Bloque 1 



Bloque 2 


Bloque 3 


*1 

*2 

*3 

*1 

*2 

*3 

*i 

*2 

*3 

0 

0 

0 

0 

0 

0 

-1.633 

0 

0 

0 

0 

0 

0 

0 

0 

1.633 

0 

0 

1 

1 

1 

1 

1 

-1 

0 

-1.633 

0 

1 

-1 

-1 

1 

-1 

1 

0 

1.633 

0 

“1 

-1 

1 

“1 

1 

1 

0 

0 

-1.633 

“1 

1 

-1 

-1 

-1 

-1 

0 

0 

1.633 







0 

0 

0 







0 

0 

0 


11-19. Formacidn de bloques del disefio central compuesto . Considere un diseno central compuesto para k = 4 varia- 
bles en dos bloques. £Puede encontrarse siempre un diseno rotable formado de bloques ortogonales? 
11-20. 6C6mo puede correrse un diseno hexagonal en dos bloques ortogonales? 
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11-21* En la tabla siguiente se muestra el rendimiento durante los cuatro primeros ciclos de un proceso quimico. 
Las variables son el porcentaje de concentracidn (x^ en los niveles 30, 31 y 32 y la temperatura (x 2 ) en 140, 
142 y 144°F. Hacer el andlisis utilizando m6todos EVOP. 


Ciclo 


Condiciones 


(i) 

(2) 

(3) 

(4) 

(5) 

1 

60.7 

59.8 

60.2 

64,2 

57.5 

2 

59.1 

62.8 

62.5 

64.6 

58.3 

3 

56.6 

59.1 

59.0 

62.3 

61.1 

4 

60.5 

59.8 

64.5 

61.0 

60.1 


11-22. Suponga que se aproxima una superfieie de respuesta con un modelo de orden d h tal como y = X ^ + e> 
cuando la verdadera superfieie est£ descrita por un modelo de orden d 2 > es decir, E( y) = + X^ 2 . 

a) Demostrar que los coeficientes de regresidn son sesgados, es decir, que E(fi^) = + P$ 2 , donde A = 

(X' J X i )" 1 X' 1 X 2 . Es comun llamar a A la matriz alias. 

b) Si d 1 = 1 y d 2 = 2, y se utiliza un diseno 2* completo para ajustar el modelo, usar el resultado del inciso a 
para determinar la estructura de los alias. 

c) Si d x = 1, d 2 = 2 y k = 3, encontrar la estructura de los alias, suponiendo que se usa un diseno 2 3 - 1 para 
ajustar el modelo. 

d) Si d x = 1, d 2 = 2 y k — 3, y se utiliza el diseno simplex del problema 11-3 para ajustar el modelo, determi- 
nar la estructura de los alias y comparar los resultados con el inciso c. 

11-23. En un articulo (“Conozcamos todos el cuadrado latino”, en Quality Engineering , vol. 1, pp. 453-465), J.S. 
Hunter ilustra algunos de los problemas asociados con los disenos factoriales fraccionados 3 k ~p. El factor^ 
es la cantidad de etanol agregada a un combustible estdndar y el factor B representa la relation aire/com- 
bustible. La variable de respuesta es la emisidn de mondxido de carbono (CO) en g/m 3 . El diseno se mues- 
tra abajo: 



Diseno 


Observaciones 

y 

A 

B 


*2 

0 

0 

-1 

-1 

66 


62 

1 

0 

0 

-1 

78 


81 

2 

0 

+ 1 

-1 

90 


94 

0 

1 

-1 

0 

72 


67 

1 

1 

0 

0 

80 


81 

2 

1 

+1 

0 

75 


78 

0 

2 

-1 

+1 

68 


66 

1 

2 

0 

+1 

66 


69 

2 

2 

+1 

+1 

60 


58 


Observe que se ha usado el sistema de notacidn de 0, 1 y 2 para representar los niveles bajo, intermedio y alto 
de los factores. Se ha usado tambi6n una “notacidn geomtirica” de -1, 0 y + 1. Se hacen dos replicas de cada 
corrida del diseno. 

a) Verificar que el modelo de segundo orden 

y= 78.5+ 4.5*, - 7.0x 2 - 4.5xf - 4. Ox 2 - 9.0x,x 2 
es un modelo razonable para este experimento. Tfazar los contomos de la concentracidn de CO en el es- 
pacio x l9 Jt 2 . 
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b) Suponga ahora que cn lugar de s61o dos factores, se usaron cuatro factores en un disefio factorial frac- 
cionado 3 4 ~ 2 y que se obtuvieron exactamente los mismos datos que en el inciso a. El disefio seria el si- 
guiente: 


Disefio Observaciones 


A 

B 

c 

D 

*1 

*2 

*3 

*4 



0 

0 

0 

0 

-1 

-1 

-1 

-1 

66 

62 

1 

0 

1 

1 

0 

-1 

0 

0 

78 

81 

2 

0 

2 

2 

+ 1 

-1 

+1 

+1 

90 

94 

0 

1 

2 

1 

-1 

0 

+1 

0 

72 

67 

1 

1 

0 

2 

0 

0 

-1 

+1 

80 

81 

2 

1 

1 

0 

+1 

0 

0 

"1 

75 

78 

0 

2 

1 

2 

-1 

+1 

0 

+1 

68 

66 

1 

2 

2 

0 

0 

+1 

+1 

-1 

66 

69 

2 

2 

0 

1 

+1 

+1 

-1 

0 

60 

58 


Confirmar que este disefio es un arreglo ortogonal L 9 . 

c) Calcular los promedios marginales de la respuesta CO en cada nivel de los cuatro factores^, B, CyD. 
Construir gr&ficas de estos promedios marginales e interpretar los resultados, 6 Los factores CyD pare- 
cen tener efectos grandes? iEstos factores tienen en realidad algun efecto sobre la emisidn de CO? LYoi 
qug su efecto aparente es grande? 

d) El disefio del inciso b permite el ajuste del modelo 

y=0 o + 2 A*. +2 Pu x i +s 

i-i i=i 

Suponga que el verdadero modelo es 

y= fi. +2 P‘ x i + 2 + 212 Pa x ‘ x i - e 

;=i i-i i<j 

Demostrar que si las ft representan las estimaciones de minimos cuadrados de los coeficientes del mode- 
lo ajustado, entonces 


ft 0 ^13 ft 14 ft 34 

) = Pi ~ (fii3 + ftl4 ~^*ft$4 V ^ 

E(h)~ ft 4 2 

^{ftll ) = ftn~ (ft 23 “ ft 24 )! ^ 

^(^22) ’^22 + 0^13 + ft U +^34)/ 2 

^(ft 33 ) “ ft 33 ~{ftlA ^ ft 12 )/2 + ^ 14 
E(ft 44 ) “ ftm ^iftn — ft 23 )/2 + /? 13 

£Ayuda esto a explicar los efectos grandes de los factores CyD que se observaron grdficamente en el in- 
ciso c? 
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11-24. Suponga que es necesario disenar un experimento para ajustar un modelo cuadratico en la region -1 < < 

+1, i = 1, 2 sujeto a la restriccidn x, +r 2 <l. Si se viola la restriction, el proceso no funcionara adecuada- 
mente. No es posible hacer m&s de n = 12 corridas. Establecer los siguientes diseiios: 

a) Un modelo DCC “inscrito” con punto central en x L = x 2 = 0. 

b) Un diseno factorial 3 2 “inscrito” con punto central en x x = x 2 = -0.25. 

c) Un diseno optimal D. 

d ) Un diseno optimal D modificado que sea identico al del inciso c, pero con todas las rdplicas de las corri- 
das en el centro del diseno. 

e) Evaluar el criterio l(X'X)- 1 ! para cada diseno. 

f) Evaluar la eficiencia D para cada diseno en comparacion con el diseno optimal D del inciso c. 

g) cQue diseno preferiria el lector? iPor que? 

11-25. Considere un diseno 2 3 para ajustar un modelo de primer orden. 

a ) Evaluar el criterion l(X'X)- 1 ! para este diseno. 

b ) Evaluar el criterio A tr(X'X)' 1 para este diseno. 

c) Encontrar la varianza de predicci6n escalada maxima para este diseno. iEste diseno es optimal G? 

11-26. Repetir elproblema 11-25 utilizando un modelo de primer orden con las interacciones de dos factores. 

11-27. Un ingeniero quimico desea ajustar una curva de calibration para un nuevo procedimiento utilizado para 

medir la concentracidn de un ingrediente particular de un producto fabricado en sus instalaciones. Pueden 
prepararse 12 muestras, cuya concentratidn es conocida. El ingeniero quiere construir un modelo para las 
concentraciones medidas. Piensa que una curva de calibration lineal serd adecuada para modelar la concen- 
tration medida como una funcidn de las concentraciones conocidas; es decir.y = Pn + fa + dondex es la 
concentraciOn real. Est&n bajo consideration cuatro disenos experimentales. El diseno 1 consta de seis corri- 
das con la concentration conocida 1 y seis corridas con la concentration conocida 10. El diseno 2 consta de 
cuatro corridas con las concentraciones 1, 5.5 y 10. El diseno 3 consta de tres corridas con las concentraciones 
1, 4, 7 y 10. Por ultimo, el diseno 4 consta de tres corridas con las concentraciones 1 y 10 y seis corridas con la 
concentraci6n 5.5. 

a) Graficar la varianza de predicci6n escalada para los cuatro disenos en la misma grafica en el rango de la 
concentraci6n 1 < x £ 10. <LQu6 diseiio serfa preferible? 

b) Calcular el determinante de (X'X)- 1 para cada diseno. cQue diseno serfa preferible de acuerdo con el 
criterio D1 

c) Gal cn lar la eficiencia de cada diseno en comparacion con el “mejor” diseno que se haya encontrado en 
el inciso b. 

d) Para cada diseno, calcular la varianza de predicci6n promedio en el conjunto de puntos dado por x = 1, 
1.5, 2, 2.5, .... 10. cQue diseno serfa preferible de acuerdo con el criterio K? 

e) Calcular la eficiencia Kde cada diseno en comparacidn con el mejor diseno que se haya encontrado en el 
inciso d. 

f) iCudl es la eficiencia G de cada diseiio? 

11-28. Resolver de nuevo el problema 11-27, suponiendo que el modelo que el ingeniero quiere ajustar es cuadr&ti- 
co. Evidentemente, ahora sdlo pueden considerarse los disenos 2, 3 y 4. 

11-29. Un experimentador quiere correr un experimento de una mezcla de tres componentes. Las restricciones so- 
bre las proporciones de los componentes son las siguientes: 

Q.lZx^QA 

0.1 < 0.3 

0.4 <x 2 £ 0.7 

a) Establecer un experimento para ajustar un modelo cuadrdtico para mezclas. Usar n = 14 corridas, con 
cuatro replicas. Usar el criterio D. 

b) Ttazar la region experimental. 
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c) Establecer un experimento para ajustar un modelo cuadrdtico para mezclas con n = 12 corridas, supo- 
niendo que tres de estas corridas son replicas. Usar el criterio D . 

d) Comentar los dos disenos que se encontraron. 

11-30, Myers y Montgomery [85a] describen un experimento con una mezcla de gasolina en el que intervienen tres 
componentes de la mezcla. No hay restricciones sobre las proporciones de la mezcla, y se usd el siguiente di- 
seho con 10 corridas: 


Punto del diseno 


*2 

*3 

y, mi/gal 

1 

1 

0 

0 

24.5, 25.1 

2 

0 

1 

0 

24.8, 23.9 

3 

0 

0 

1 

22.7, 23.6 

4 

] 

2 

1 

2 

0 

25.1 

5 

J 

0 

1 

2 

24.3 

6 

0 

1 

2 

1 

2 

23.5 

7 

I 

1 

T 

1 

3 

24.8, 24.1 

8 

2 

3 

i 

6 

1 

6 

24.2 

9 

1 

6 

2 

3 

1 

6 

23,9 

10 

1 

6 

1 

6 

2 

3 

23.7 


a) £Qu6 tipo de diseno utilizaron los experimentadores? 

b) Ajustar un modelo cuadrdtico para mezclas a los datos. LEs adecuado este modelo? 

c) Graficar los contomos de la superficie de respuesta. LQu6 mezcla se recomendana para maximizar las 
millas por galdn? 

11-31, Considere el experimento del llenado de las botellas del ejemplo 6-1. Suponga que el porcentaje de carbona- 
tacidn (A) es una variable de ruido (en unidades codificadas o\ - 1). 

a) Ajustar el modelo de respuesta a estos datos. iSt trata de un problema de diseno robusto? 

b) Encontrar el modelo de la media y el modelo de la varianza o bien la POE. 

c) Encontrar un conjunto de condiciones que resulten en una desviacidn del llenado promedio tan prdxima 
a cero como sea posible con varianza transmitida minima. 

11-32. Considere el experimento del problema 11-12, Suponga que la temperatura es una variable de ruido ( a\ = 1 
en unidades codificadas). Ajustar modelos de respuesta para las dos respuestas. LSz trata de un problema de 
diseno robusto con respecto a ambas respuestas? Encontrar un conjunto de condiciones que maximicen la 
conversidn con la actividad entre 55 y 60 y que minimice la variabilidad transmitida por la temperatura. 

11-33. Se ha corrido un experimento en un proceso que aplica un material de recubrimiento a una oblea. En cada 
corrida del experimento se fabricd una oblea y se midid varias veces el espesor del recubrimiento en varios si- 
tios de la misma. Despues se obtuvo la mediay L y la desviacidn estlndary 2 de la medicidn del espesor. Los da- 
tos (adaptados de Box y Draper [16b]) se muestran en la tabla siguiente: 


Corrida Velocidad 


1 - 1.000 

2 0.000 

3 1.000 

4 -1.000 

5 0.000 

6 1.000 

7 -1.000 


Presidn 

Distancia 

Media 

yi 

Desviacidn estdndar 

yi 

- 1.000 

- 1.000 

24.0 

12.5 

- 1.000 

-1,000 

120.3 

8,4 

- 1.000 

- 1.000 

213.7 

42.8 

0.000 

-1.000 

86.0 

3.5 

0.000 

- 1.000 

136.6 

80.4 

0.000 

- 1.000 

340.7 

16.2 

1.000 

- 1.000 

112.3 

27.6 
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Corrida 

Velocidad 

Presi6n 

Distancia 

Media 

yt 

Desviacidn estAndar 

y % 

8 

0*000 

1.000 

- 1.000 

256.3 

4,6 

9 

1.000 

1.000 

- 1.000 

271.7 

23.6 

10 

- 1.000 

- 1.000 

0.000 

81.0 

0.0 

11 

0.000 

- 1.000 

0.000 

101.7 

17.7 

12 

1.000 

- 1.000 

0.000 

357.0 

32.9 

13 

- 1.000 

0.000 

0.000 

171.3 

15.0 

14 

0.000 

0.000 

0.000 

372.0 

0.0 

15 

1.000 

0.000 

0.000 

501,7 

92.5 

16 

- 1.000 

1.000 

0.000 

264.0 

63.5 

17 

0.000 

1.000 

0.000 

427.0 

88.6 

18 

1.000 

1.000 

0.000 

730.7 

21,1 

19 

- 1.000 

- 1.000 

1,000 

220.7 

133.8 

20 

0.000 

- 1.000 

1.000 

239.7 

23.5 

21 

1.000 

- 1.000 

1.000 - 

422.0 

18.5 

22 

- 1.000 

0.000 

1.000 

199.0 

29.4 

23 

0.000 

0.000 

1.000 

485.3 

44.7 

24 

1.000 

0.000 

1.000 

673,7 

158.2 

25 

- 1.000 

1.000 

1.000 

176.7 

55,5 

26 

0.000 

1.000 

1.000 

501.0 

138.9 

27 

1.000 

1.000 

1.000 

1010.0 

142.4 


a) £Qu6 tipo de diseno utilizaron los experimentadores? 6Es 6sta una buena eleccidn del diseno para ajus- 
tar un modelo cuadrdtico? 

b) Construir los modelos para ambas respuestas. 

c) Encontrar un conjunto de condiciones 6ptimas que resulten en una media tan grande como sea posible 
con la desviacidn estdndar menor que 60. 

11-34. Una variacidn del ejemplo 6-2. En el ejemplo 6-2 se encontr6 que una de las variables del proceso (B = pre- 
sidn) no era importante. A1 eliminar esta variable se producen dos r6plicas de un diseno 2 3 . Los datos se 
muestran enseguida: 


C 

D 

A(+) 

A (-) 

y 

s 2 

- 

- 

45,48 

71,65 

57.75 

121.19 

+ 

- 

68,80 

60,65 

68.25 

72.25 

- 

+ 

43,45 

100, 104 

73.00 

1124.67 

+ 

+ 

75,70 

86, 96 

81.75 

134.92 


Suponer que Cy D son factores controlables y que A es una variable de ruido. 

a) Ajustar un modelo para la respuesta media. 

b) Ajustar un modelo para la respuesta ln(s 2 ). 

c) Encontrar las condiciones de operacidn que resulten en la respuesta de rapidez de filtracidn media que 
exceda 75 con varianza minima. 

d) Comparar los resultados obtenidos con los del ejemplo 11-6, en el que se aplicd el enfoque de la transmi- 
si6n del error. iHasta que punto son similares las dos respuestas? 




Experimentos 
con factores 
aleatorios 


A lo largo de gran parte de este libro se ha supuesto que los factores de un experimento son factores fijos, 
es decir, los niveles de los factores usados por el experimentador son los niveles de interns especffico. La 
implicad6n de esto es, desde luego, que las inferencias estadfsticas que se hacen acerca de estos factores 
se restringen a los niveles especfficos estudiados. Es decir, si se investigan tres tipos de materiales, como 
en el experimento de la vida de la bateria del ejemplo 5—1, las conclusiones s61o son validas para esos ti- 
pos especfficos de materiales. Una variante de esto ocurre cuando el factor o factores son cuantitativos. 
En estas situaciones, con frecuencia se usa un modelo de regresion que relaciona la respuesta con los fac- 
tores para predecir la respuesta en la region que abarcan los niveles de los factores usados en el diseho ex- 
perimental. Varios ejemplos de esto se presentaron en los capftulos 5 al 9. En general, cuando se trabaja 
con un efecto fijo, se dice que el espacio inferencial del experimento es el conjunto especffico de los nive- 
les de los factores investigados. 

En algunas situaciones experimentales, los niveles de los factores se eligen al azar de una poblacion 
mSs grande de niveles posibles, y el experimentador quiere sacar conclusiones acerca de la poblacidn 
completa de los niveles, no solo de los que se usaron en el diseho experimental. En esta situacion se dice 
que se trata de un factor aleatorio. Se empieza con una situacion simple, un experimento con un solo fac- 
tor en el que el factor es aleatorio y se usa esto para introducir el modelo de efectos aleatorios para el ana- 
lisis de varianza y los componentes de la varianza. Los factores aleatorios ocurren tambien normalmente 
en experimentos factoriales, asf como en otros tipos de experimentos. Este capftulo se enfoca en los mdto- 
dos para el diseho y anhlisis de experimentos factoriales con factores aleatorios. En el capftulo 13 se pre- 
sentaran los disenos anidados y de parcelas subdivididas, dos situaciones en las que es frecuente 
encontrar factores aleatorios en la pr&ctica. 


12-1 MODELO CON EFECTOS ALEATORIOS 

Es comun que un experimentador estd interesado en un factor que tiene un gran ntimero de posibles nive- 
les. Cuando el experimentador selecdona aleatoriamente a de estos niveles de la poblacidn de los niveles 
del factor, entonces se dice que el factor es aleatorio. Puesto que los niveles del factor utilizados realmente 
en el experimento se eligieron al azar, se hacen inferencias acerca de la poblacidn completa de los niveles 
del factor. Se supone que la poblackm de los niveles del factor es de tamaho infinito o bien lo suficientemen- 
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te grande para considerarla infinita. No es frecuente encontrar situaciones en las que la poblacion de los ni- 
veles del factor sea lo suficientemente pequeiia para emplear el enfoque de una poblacidn finita. Referirse 
a Bennett y Franklin [9] y Searle y Fawcett [101] para una revisidn del caso de una poblaci6n finita. 
El modelo estadistico lineal es 


y..= M +r.+e 


i = 1, 

nj= 


= 1, 2, ..., a 


( 12 - 1 ) 


donde tanto r, como e 9 son variables aleatorias. Si r, tiene varianza o) yes independiente de E ip la varianza 
de cualquier observacidn es 

V(y,)=o\+o 2 

A las varianzas a 2 y o 2 se les llama los componentes de la varianza, y al modelo (ecu ad on 12-1) se le llama 
modelo de efectos aleatorios o de los componentes de la varianza. Para probar hipotesis en este modelo se 
requiere que las {e, y } sean NID(0, o\ que las {r,} sean NID(0, a\ ), y que r, y e, sean independientes. 1 
La suxna de cuadrados identidad 


SS T = 55 Tratamientos +SS E (12-2) 

sigue siendo v&lida. Es decir, se hace la particion de la variabilidad total en las observaciones en un com- 
pcnente que mide la variacion entre los tratamientos (55 1Yatamient0S ) y un componente que mide la variation 
dentro de los tratamientos ( SS E ). Probar hipdtesis acerca de los efectos de tratamientos individuales no 
tiene sentido, por lo que en su lugar se prueban hipdtesis acerca del componente de la varianza a \ : 


H,:al=0 

' 2 >0 


Hv a t 


(12-3) 


Si a\ = 0, todos los tratamientos son id^nticos; pero si a\ > 0, existe variabilidad entre los tratamientos. 
Como anteriormente, SS^/cr 2 se distribuye como ji-cuadrada con N-a grados de libertad y, bajo la hipdte- 
sis nula, SS -n^^.J a 2 se distribuye como ji-cuadrada con a - 1 grados de libertad. Ambas variables alea- 
torias son independientes. Por lo tanto, bajo la hipotesis nula a \ — 0, el cociente 


SS 


F 0 =- 


Tratamientog 

q-1 

ss E 

N-a 


MS 


Tratamientos 


MS, 


(12-4) 


se distribuye como F con a — 1 y N — cl grados de libertad. Sin embargo, es necesario examinar los cuadra- 
dos medios esperados para tener la descripcidn completa del procedimiento de prueba. 

Considere 


1 1 
E(MS Tl ^ cntos )- — E(SS 

Tratamientos ) 

1 


a - 1 


i=> \i = 1 



v y L 

-1 E 

A — 

. 1=1 n 

\2 / 


l 

+ £ 

— 

V 

N\ 


\ 2 ' 


i=l ;=1 


Cuando se eleva al cuadrado y se toma la funcidn esperanza de las cantidades entre corchetes, se observa 
que los t6rminos que incluyen a r 2 son reemplazados por como£(r,) = 0. Ademas, los terminos que in- 


i El supuesto de que las {r ( }son variables aleatorias independientes implica que el supuesto usual de que t , = 0 del modelo de 

efectos fijos no se aplica al modelo de efectos aleatorios. 
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cluyen a e], e 2 y son reemplazados por no 2 , a/uj 2 y 0 /i 2 < 7 2 , respectivamente. Por otra parte, to- 

dos los productos cruzados que incluyen a r, y 8$ tienen valor esperado cero, Esto lleva a 

£ ( M5 TratWnto S ) = [NjU 2 + No] + dO 1 ~ Nfl 2 ~ Ito] ~ <J 2 ] 


o 


^( M 5 Tratamientos ) = o 2 +no 2 T (12-5) 

De manera similar, puede demostrarse que 

E(MS e ) = o 2 (12-6) 

Por los cuadrados medios esperados, se observa que bajo H 0 tanto el numerador como el denomina- 
dor del estadistico de prueba (ecuacidn 12-4) son estimadores insesgados de a 2 , mientras que bajo H 1 el 
valor esperado del numerador es mayor que el valor esperado del denominador. Por lo tanto, H Q deber& 
rechazarse para los valores de F 0 que sean muy grandes. Esto implica una regidn critica de una cola supe- 
rior, por lo que H 0 se rechaza si F 0 > F a a _ 1N _ fl . 

El procedimiento de c£lculo y el an£lisis de la tabla de varianza del modelo de efectos aleatorios son 
id£nticos a los que se utilizaron en el caso de efectos fijos. Sin embargo, las conclusiones son muy diferen- 
tes, ya que se aplican a la poblacidn completa de los tratamientos. 

Por lo general habr& interns en estimar los componentes de la varianza (a 2 y a 2 ) del modelo. AI pro- 
cedimiento que se usa para estimar a 2 y a 2 se le llama metodo del andlisis de varianza, ya que hace uso de 
las lineas de la tabla del analisis de varianza. El procedimiento consiste en igualar los cuadrados medios 
esperados con sus valores observados en la tabla del an&lisis de varianza y despejar los componentes de la 
varianza. Al igualar los cuadrados medios observados con los esperados en el modelo de efectos aleato- 
rios con un solo factor, se obtiene 

^ Tratamientos = a 1 +no] 

y 


MS e = a 1 

Por lo tanto, los estimadores de los componentes de la varianza son 

a 2 = MS e 


^ 2 ^^Tralamientos 


Para tamanos de las muestras desiguales, se reemplaza n en la ecuacidn 12*8 con 


a 



1=1 


(12-7) 

( 12 - 8 ) 


(12-9) 


En el m£todo del an£lisis de varianza para estimar los componentes de la varianza no se requiere el 
supuesto de normalidad. Produce estimadores de G^y o] que son los mejores estimadores cuadraticos in- 
sesgados (es decir, de todas las funciones cuadr&ticas insesgadas de las observaciones, estos estimadores 
tienen minima varianza). 
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Ocasionalmente, el m6todo del an&lisis de varianza produce una estimacidn negativa de uno de los 
componentes de la varianza. Evidentemente, los componentes de la varianza son por definicion no nega- 
tives, por lo que la estimacidn negativa de un componente de la varianza se considera con cierta preocu- 
paddn. Un curso de accidn es aceptar la estimacion y usarla como evidencia de que el verdadero valor del 
componente de la varianza es cero, suponiendo que la variacion muestral llevd a la estimacion negativa. 
Esto tiene un atractivo intuitivo, pero adolece de algunas dificultades teoricas. Por ejemplo, usar cero en 
lugar de la estimaci6n negativa puede alterar las propiedades estadisticas de otras estimaciones. Otra al- 
ternativa es volver a estimar el componente de la varianza negativa utilizando un metodo que produzca 
siempre estimaciones no negativas. Una alternativa mas es considerar la estimacion negativa como evi- 
dencia de que el modelo lineal supuesto es incorrecto y examinar de nuevo el problema. El tratamiento 
completo de la estimacidn de los componentes de la varianza se ofrece en Searle [99a, b], Searle, Casella y 
McCullogh [100] y Burdick y Graybill [22], 


EJEMPLO 

Una compania textil fabrica un tejido en un gran numero de telares. Le gustaria que los telares fueran ho- 
mogeneos a fin de obtener un tejido de resistencia uniforme. El ingeniero del proceso sospecha que, ade- 
nitis de la variacion usual de la resistencia dentro de las muestras del tejido del mismo telar, puede haber 
tambi6n variaciones significativas en la resistencia entre un telar y otro. Para investigar estaposibilidad, el 
ingeniero selecciona cuatro telares al azar y hace cuatro determinaciones de la resistencia del tejido fabri- 
cado en cada telar. Este experimento se corre de manera aleatoria, y los datos obtenidos se muestran en la 
tabla 12-1. Se realiza el an^lisis de varianza, el cual se muestra en la tabla 12-2. Por el analisis de varianza 
se concluye que los telares de la planta difieren significativamente. 

Los componentes de la varianza se estiman con d 1 — 1.90 y 


29.73- 1.90 = 6 _ 96 


Por lo tanto, la va rianz a de cualquier observacidn de la resistencia se estima con 

d r = d 2 +d\= 1.90+6.96= 8.86. 

La mayor parte de esta variabilidad es atribuible a las diferencias entre los telares. 


Este ejemplo ilustra un uso importante de los componentes de la varianza: la separacidn de las dife- 
rentes fuentes de variabilidad que afectan un producto o sistema. El problema de la variabilidad de un 
producto se presenta coni frecuencia en el control de calidad, y en muchas ocasiones es dificil aislar las 


Tabla 12-1 Datos de la resistencia del ejemplo 12-1 


Tfelares 


Observations 


yt 

1 

2 

3 

4 

1 

98 

97 

99 

96 

390 

2 

91 

90 

93 

92 

366 

3 

96 

95 

97 

95 

383 

4 

95 

96 

99 

98 

388 


1527 =y_ 
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Tabla 12-2 

Andlisis de varianza de los datos de la resistencia 




Fuente de 
variation 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

F o 

Valor P 

Tblares 

Error 

Total 

89.19 

22.75 

111.94 

3 

12 

15 

29.73 

L90 

15.68 

<0.001 


fuentes de la variabilidad. Por ejemplo, este estudio puede haber sido motivado por una gran variabilidad 
en la resistencia del tejido, como se ilustra en la figura 12- la. En esta grafica se presenta la salida del pro- 
ceso (resistencia del tejido) modelado como una distribucidn normal con varianza 6; = 8.86. (Esta es la 
estimacidn de la varianza de cualquier observation de la resistencia del ejemplo 12-1.) Las especificacio- 
nes superior e inferior de la resistencia se muestran tambien en la figura 12-la, y es relativamente inme- 
diato ver que una proporcidn bastante grande de la salida del proceso se sale de las especificaciones (las 
dreas sombreadas de las colas de la figura 12- la). El ingeniero del proceso se ha preguntado por que es 
tan grande la cantidad de tejido defectuoso que debe desecharse, reelaborarse o degradarse a un produc- 
to de menor calidad. La respuesta es que la mayor parte de la variabilidad de la resistencia del producto es 
el resultado de las diferencias entre los telares. El desempeno irregular de los telares podria ser el resulta- 
do de una instalaci6n incorrecta, un mantenimiento deficiente, una supervision ineficaz, operadores sin 
la capacitacidn suficiente, fibra de entrada defectuosa, etcetera. 

El ingeniero del proceso debe intentar ahora aislar las causas especificas de la diferencia en el desem- 
peno de los telares. Si pudiera identificar y eliminar estas fuentes de variabilidad entre los telares, seria 
posible reducir considerablemente la varianza de la salida del proceso, quiza hasta a] = 1.90, la estima- 
ci6n del componente de la varianza dentro del telar (error) en el ejemplo 12-1. En la figura 12-15 se mues- 
tra la distribucidn normal de la resistencia de la fibra con a^ y = 1.90. Observe que la proportion del 
producto defectuoso en la salida se ha reducido radicalmente. Aun cuando es improbable que pueda eli- 
minarse toda la variabilidad entre los telares, es claro que una reduction significativa en este componente 
de la varianza incrementaria sensiblemente la calidad de la fibra producida. 



LS (especificacidn inferior) US (especificacldn superior) 


a) Variabilidad de la salida del proceso. 



Figura 12-1 Salida del proceso en el problema de la 
resistencia de la fibra. 
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Es sencillo encontrar un intervalo de confianza para el componente de la varianza a 2 . Si las observa- 
ciones siguen una distribution normal e independiente, entonces (N — a )MS E /o 2 se distribuye como x N _ a - 
Por lo tanto, 


\xl 


( a/2),N-a 


- ( N-a)MS , , 

— 2 — A all.N-a 

O 


- 1-a 


y un intervalo de confianza de 100(1 - a) por ciento para a 2 es 

(N-a)MS E ^ {N-a)MS E 

Xa/2,N-a X\-(a!2),N-a 


(12-10) 


Considere ahora el componente de la varianza o \ . El estimador puntual de a r es 

4,2 ^^Tratamientos E 


La variable aleatoria (a - + na]) se distribuye como zU> y( N ~ a ) MS E^ se distribuye 

como Xn-z- Po r 1° tanto ? la distribucidn de probabilidad de & 2 es una combinacidn lineal de dos variables 
aleatorias ji-cuadrada, por ejemplo 

U \Xa-l ~ U 2 Xtf-a 

donde 

_o 2 +no 2 r o 2 
Ul ~ n(a-V> y “ 2_ n(iV-fl) 

Desafortunadamente, no puede obtenerse una expresidn predeterminada para la distribucidn de esta 
combinacidn lineal de variables aleatorias ji-cuadrada. Por lo tanto, no es posible construir un intervalo 
de confianza exacto para a 2 . En Graybill [50] y Searle [99a] se presentan procedimientos aproximados. 

Ver tambien la seccidn 12 t7. 2 2 

Es sencillo encontrar una expression exacta para un intervalo de confianza del cociente a v /(cr ^ + cr). 
Se trata de un cociente con significado, ya que refleja la proportion de la varianza de una observation [re- 
cuerde que V(y 0 ) = <r 2 + cr 2 ] que es el resultado de las diferencias entre los tratamientos. Para desarrollar 
este intervalo de confianza en el caso de un diseno balanceado, observe que MS TVatamientos yMS E son varia- 
bles aleatorias independientes y, adem&s, que puede demostrarse que 

MS TmMBicnto J (no 2 r +o 2 ) 

MS e /o 2 


Por lo tanto, 


F < ■ 

r \-al2 >a -\,N-a ~ 


ms t 


MS e noi+o 


— < p 

2 , „2 — r a/2,a-l,N-a 


= 1 -a 


A1 reordenar la ecuacidn 12-11, puede obtenerse la siguiente expresion: 

p{ L< ( ~^u\~ \ -a 


( 12 - 11 ) 


(12-12) 


donde 



MS-r 


MS; 


1 


[ a/2,a-l,N-a 



(12-13a) 



12-2 DISENO FACTORIAL DE DOS FACTORES ALEATORIOS 517 


y 


u= 


1 

MS 

J A ^ Tratamientos 

1 

n 

MS e 

f 

r l-a/2 t a-hN-a 


(12-13b) 


Observe que L y U son los li'mi tes de confianza inferior y superior del intervalo 100(1 - a) por ciento, res- 
pectivamente, del cociente a] la 1 . Por lo tanto, un intervalo de confianza de 100(1 - a) por ciento para 
a)l(a) + a 2 ) es 


1 + L' 


al+: 


U 

\+u 


(12-14) 


Para ilustrar este procedimiento, se encontrard un intervalo de confianza de 95% de a 2 J{a] + a 2 ) 
para los datos de la resistencia del ejemplo 12-1. Recuerde que MS Tratamient05 = 29.73, MS E = 1.90, a = 4, n 
= 4,F 0 0 25 3 12 = 4.47yF 0 975i 3 jl2 = l/Fo. 025 , 12,3 = 1/14.34 = 0.070. Por lo tanto, por las ecuaciones 1 2- 1 3a y b, 



y por la ecuacidn 12-12, el intervalo de confianza de 95% para a 2 /(a ] + a 2 ) es 

0.625 a\ 54.883 
1.625 “ a\ +a 2 ~ 55.883 


o 

a 2 

0.39^ - r , <0.98 

a 2 +a 2 

Se concluye que la variabilidad entre los telares explica entre 39 y 98% de la varianza en la resistencia ob- 
servada del tejido producido. Este intervalo de confianza es relativamente ancho debido al tamaiio pe- 
queno de la muestra que se usd en el experimento. Sin embargo, es evidente que la variabilidad entre los 
telares (aj) no es insignificante. 


12-2 DISENO FACTORIAL DE DOS FACTORES ALEATORIOS 

Suponga que se tienen dos factores, A y B, y que ambos tienen un gran numero de niveles de interns 
(como en la seccidn anterior, se supondra que el numero de niveles es infinito). Se escogeran al azar a ni- 
veles del factors y b niveles del factor B, y estos niveles de los factores se incluiran en un diseno experi- 
mental factorial. Si el experimento se hace con n replicas, las observaciones pueden representarse con el 
modelo lineal 

[7 = 1, 2, ..., a 

y,k=M+h+P j +(TP) ii +£ lik 0 = 1, 2,..., b (12-15) 

[fc = l, 2, ..., n 

donde todos los parfimetros del modelo, r„ /?,, (r/3), ; y e ijk , son variables aleatorias independientes. Tambien 
se supondra que las variables aleatorias r„ fy, (r/?) 9 y e ijk siguen una distribucion normal con media cero y 
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varianzas dadas por K(r,) = = a\, F[(r/3), y ] = o\ y V(e ijk ) = a 2 . Por lo tanto, lavarianza de cual- 

quier observacidn es 

v (y*) ma l + °l +a * +a2 ( 12 ‘ 16 ) 

y a] ,o 2 , y a 2 son los componentes de lavarianza. Las hip6tesis que quieren probarse son H a :o l = 0, 
H 0 :o 2 p = Oy H 0 :ol p = 0. Observe la similitudcon el modelo de efectos aleatorios de un solo factor. 

Los c&lculos num6ricos del analisis de varianza se mantienen sin cambios; es decir, SS A , SS B , SS^, SS T 
y SS E se calculan como en el caso de efectos fijos. Sin embargo, para formar los estadisticos de prueba, de- 
ben examinarse los cuadrados medios esperados. Puede demostrarse que 

E(MS A )=° 2 +na h +bno r 

E(MS b ) = a 1 +no 2 I/s +ana 2 (12-17) 

E(MSab ) = a 2 +no 2 tfj 


E(MS e ) = o 2 

Por los cuadrados medios esperados se observa que el estadistico apropiado para probar la hipotesis 
de que no hay interacddn, H 0 :a 2 ^ = 0, es 

MV 

(12-18) 


^0 = 


M5 r 


ya que bajo H 0 tanto el numerador como el denominador de F 0 tienen valor esperado d 2 , y s61o si H 0 es fal- 
sa E{MS ab ) es mayor que E(MS e ). El cociente F 0 se distribuye como F {a _ 1} ab(n _xj.De manera similar, para 
probar H 0 :ol = 0 se usarfa 


F °-%t (12 ' 19) 


que se distribuye como F a _ 1( (a _ w _ y, y para probar H a \o 2 p 


ms b 

MS m 


0 el estadistico es 


( 12 - 20 ) 


que se distribuye comoF fc _ 1(lI _ 1)()) _i ) . Todas estas pruebas son de una sola cola superior. Observe que estos 
estadisticos de prueba no son los mismos que se usarian si ambos f act ores zl y B fuesen fijos. Los cuadra- 
dos medios esperados se usan siempre como guia para construir los estadisticos de prueba. 

En muchos experimentos que incluyen factores aleatorios existe al menos interns tanto en estimar los 
componentes de la varianza como en la prueba de las hipdtesis. Los componentes de la varianza pueden 
estimarse con el mctodo del an&lisis de varianza, es decir, igualando los cuadrados medios observados de 
las lineas de la tabla del anfllisis de varianza con sus valores esperados y resolviendo para los componentes 
de la varianza. Se obtiene asi 

& 2 = ms e 


. 2 ms^-ms. 


d 2 MS b~ MS ab 

p an 


( 12 - 21 ) 




bn 
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como las estimaciones puntuales de los componentes de la varianza en el modelo de efectos aleatorios de 
dos factores. En la seccidn 12-7 se revisar&n otros m6todos para obtener estimaciones puntuales de los 
componentes de la varianza y los procedimientos para construir intervalos de confianza. 

EJEMPLO 

Estudio de capacidad o aptitud de sistemas de medicidn 

Con frecuencia se usan experimentos disenados estadisticamente para investigar las fuentes de variabili- 
dad que afectan a un sistema. Una aplicacidn industrial comun es usar un experimento diseiiado para es- 
tudiar los componentes de la variabilidad en un sistema de medicidn. Estos estudios se conocen 
comunmente como estudios de capacidad o aptitud de instnunentos de medicidn (calibradores) o estu- 
dios de repetibilidad y reproductibilidad (R&R) de instnunentos de medicidn (calibradores), ya que es- 
tos son los componentes de la variabilidad de interes. 

En la tabla 12-3 se muestra un experimento R&R de instrumentos de medicidn tipico (de Montgo- 
mery [80a]). Se usa un instrumento o calibrador para medir una dimensidn critica de una pieza. Se han se- 
leccionado 20 piezas del proceso de produccion, y tres operadores escogidos al azar miden dos veces cada 
pieza con este calibrador. El orden en que se hacen las mediciones estd completamente aleatorizado, por 
lo que se trata de un experimento factorial de dos factores en el que los factores del diseno son las piezas y 
los operadores, con dos replicas. Las piezas y los operadores son factores aleatorios. Es v&lida la identi- 
dad del componente de la varianza de la ecuacion 12-15; es decir, 

o]=o]+o)+o 2 r 0 +o 2 

donde a 2 es la variabilidad total (que incluye la variabilidad debida a las diferentes piezas, la variabilidad 
debida a los diferentes operadores y la variabilidad debida al calibrador), a) es el componente de la va- 
rianza de las piezas, a\ es el componente de la varianza de los operadores, a\ es el componente de la va- 


Tabla 12-3 El experimento de la capacidad o aptitud del sistema de 
medicidn del ejemplo 12*2 

Numero de 

la pieza Qperador 1 Qperador 2 Qperador 3 


1 

21 

20 

20 

20 

19 

21 

2 

24 

23 

24 

24 

23 

24 

3 

20 

21 

19 

21 

20 

22 

4 

27 

27 

28 

26 

27 

28 

5 

19 

18 

19 

18 

18 

21 

6 

23 

21 

24 

21 

23 

22 

7 

22 

21 

22 

24 

22 

20 

8 

19 

17 

18 

20 

19 

18 

9 

24 

23 

25 

23 

24 

24 

10 

25 

23 

26 

25 

24 

25 

11 

21 

20 

20 

20 

21 

20 

12 

18 

19 

17 

19 

18 

19 

13 

23 

25 

25 

25 

25 

25 

14 

24 

24 

23 

25 

24 

25 

15 

29 

30 

30 

28 

31 

30 

16 

26 

26 

25 

26 

25 

27 

17 

20 

20 

19 

20 

20 

20 

18 

19 

21 

19 

19 

21 

23 

19 

25 

26 

25 

24 

25 

25 

20 

19 

19 

18 

17 

19 

17 
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rianza que representa la interacri6n entre las piezas y los operadores, y a 2 es el error experimental 
aleatorio. De manera tipica, al componente de la varianza o 2 se le llama la repetibilidad del instrumento 
de medicion (calibrador), ya que puede considerarse que o 2 refleja la variation obtenida cuando la misma 
pieza es medida por el mismo operador, y es comun llamar a 


la reproductibilidad del instrumento de medicidn (calibrador), ya que refleja la variabilidad adicional en 
el sistema de medicion que resulta del uso del instrumento por parte del operador. Estos experimentos 
suelen realizarse con el objetivo de estimar los componentes de la varianza. 

En la tabla 12-4 se muestra el an&lisis de varianza de este experimento. Los cfilculos se realizaron uti- 
lizando la rutina Balanced ANOVA (analisis de varianza balanceado) de Minitab. Con base en los valores 
P, se concluye que el efecto de las piezas es grande, que los operadores quiza tengan un efecto pequeno y 
que no hay ninguna interactidn significativa pieza-operador. La ecuacidn 12-21 puede usarse para esti- 
mar los componentes de la varianza de la siguiente manera: 


d2 = 6239- 0.71 = lft2g 


d\ = 




(3)(2) 
1,31-0.71 
(20)(2) ~ 
0.71-0.99 


= 0.015 
= -0.14 


y 


d 1 = 0.99 


La parte inferior de la salida de Minitab de la tabla 12-4 contiene los cuadrados medios esperados del 
modelo aleatorio, con los numeros entre pardntesis representando los componentes de la varianza [(4) 
representa a 2 , (3) representa o 2 r/) , etc.]. Se presentan tambien las estimaciones de los componentes de la 
varianza, junto con el termino del error que se utilizo para probar ese componente de la varianza en el 
analisis de varianza. Mas adelante se estudiarA la terminologia modelo no restringido; dsta no tiene rele- 
vancia en los modelos aleatorios. 

Observe que la estimation de uno de los componentes de la varianza, djj,, es negativa. Desde luego, 
esto no tiene sentido, ya que por definicidn las varianzas son no negativas. Desafortunadamente, pueden 
obtenerse estimaciones negativas de los componentes de la varianza cuando se usa el m6todo de estima- 
tion del andlisis de varianza (lo cual se considerauna de sus desventajas). Existenvarias maneras de abor- 
dar esta situation. Una posibilidad es suponer que la estimation negativa significa que el componente de 
la varianza en realidad es cero y simplemente se hace cero, dejando sin cambios las demas estimaciones 
no negativas. Otro enfoque es estimar los componentes de la varianza con un metodo que asegure estima- 
ciones no negativas (este enfoque se revisara brevemente en la section 12-7). Por ultimo, podria observar- 
se que el valor P del tdrmino de interaction de la tabla 12-4 es muy grande, tomar esto como evidencia de 
que cr 2 , es en realidad cero (es decir, que no hay efecto de interaccidn) y ajustar un modelo reducido de la 
forma 


y m =p +T i + Pi +£ nic 

que no incluye el tdrmino de interaction. Este es un enfoque relativamente sencillo y que con frecuencia 
funciona casi tan bien como los metodos mas elaborados. 
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Tabla 12-5 An&lisis de varianza del modelo reducido, ejemplo 12^2 


Analisis de varianza (disenos balanceados) 


Factor 

Type 

Levels Va 

lues 






part 

random 

20 

1 

2 

3 

4 

5 

6 

7 



8 

9 

10 

1 1 

12 

13 

14 



1 

5 

16 

17 

18 

19 

20 


operator 

random 3 

1 

2 

3 





Analysis 

of Va 

riance for 

y 







Source 

DF 

SS 


NS 


F 

P 



part 

19 

1185.425 

62.391 

70. 

64 

0.000 



operator 

2 

2.617 


1.308 

1 . 

48 

0.232 



Error 

98 

86.550 


0.883 






Total 

119 

1274.592 








Source 


Vari ance 

Err 

or Expect 

ed M 

ean Sq 

ua re 

for Each 


c 

omponen t 

te 

rm 

( u s i n 

g un 

restri 

ct ed 

mode l ) 

1 part 


10.2513 

3 


(3) + 

6(1 

) 



2 opera 

tor 

0.0106 

3 


(3) + 

40C 

2) 



3 Error 


0.8832 



(3) 






En la tabla 12-5 se muestra el analisis de varianza del modelo reducido. Puesto que no hay termino de 
interaccidn, los dos efectos principales se prueban contra el t£rmino del error, y las estimaciones de los 
componentes de la varianza son 






62.39-0.88 

(3)(2) 

1.31-0.88 


(20)(2) 
& 2 = 0.88 


= 10.25 


0.0108 


Por ultimo, la varianza del calibrador podria estimarse como la suma de las estimaciones de los compo- 
nentes de la varianza a 2 y a\ como 

^Libr.dor = S 1 +&1 

— 0.88+0.0108 
- 0.8908 

La variabilidad del calibrador parece ser pequena en comparacidn con la variabilidad del producto. Se 
trata generalmente de una situacidn deseable, la cual implica que el calibrador tiene la capacidad de dis- 
tinguir entre las diferentes gradaciones del producto. 


12-3 MODELO MIXTO CON DOS FACTORES 

Se considera ahora la situacion en que uno de los factores,,/) , esta fijo y el otro, B, es aleatorio. Se le llama 
analisis de varianza del modelo mixto. El modelo estadistico lineal es 

i = l,2,..., a 
;' = 1,2,..., b 

k = l,2,...,n 


y ijk =H+*i +Pj + (rf)ij +E ijk 


( 12 - 22 ) 
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Aqui r, es un efecto fijo,/l ; es un efecto aleatorio, se supone que la interaccibn (r/3), y es un efecto aleatorio y 
Ejjk es un error aleatorio. Se supone tambien que las {r,} son efectos fijos tales que 2°_ 1 r i = Oy que /J ; - es 
una variable aleatoria NID(0, ct 2 ). El efecto de la interaccibn, (r/3) y , es una variable aleatoria normal con 
media Oyvarianza [(a - \)la]a 0 \ sin embargo, la operacion suma del componente de la interaccibn en el 
rango del factor fijo es igual a cero. Es decir, 

t, w)ij=mi= o j=h2,...,b 

i=l 


Esta restriccibn implica que algunos elementos de la interaccibn en diferentes niveles del factor fijo no 
son independientes. De hecho, puede demostrarse (ver el problema 12-25) que 

Cov[(^),.,(^) <y ] = -icr^ i*i' 


La covarianza entre (r/3),y y (r/8), r para j * j' es cero, y el error aleatorio e ijk es NID(0, o 2 ). Puesto que la 
suma de los efectos de la interaccibn en los niveles del factor fijo es igual a cero, a esta versibn del modelo 
mixto con frecuencia se le llama modelo restringido. 

En este modelo la varianza de (i p) tj se define como [(a - l)la\a] 0 en vez de como o 0 para simplificar 
los cuadrados medios esperados. El supuesto (r/?) ; = 0 tambien tiene un efecto sobre los cuadrados me- 
dios esperados, los cuales puede demostrarse que son 

bn 2 

E(MS A ) = o 2 +no 2 t0 + - 

< 2—1 

E(MS g ) = a 2 +ana 2 0 

E(MS M ) = a 2 +na 2 0 (12-23) 


y 


E(MS e )~o 2 


Por lo tanto, el estadistico de prueba apropiado para probar que las medias de los efectos del factor fijo 
son iguales, o H 0 :t ( = 0, es 


*o = 


MS A 
MS ^ 


que tiene la distribucibn de referenda . 1 (a . 1)(il _ 1} . Para probar // 0 : < 7 2 , el estadistico de prueba es 

F -M?JL 

0 MS e 


con la distribucibn de referenda F b _ t ab{n _ X) . Por ultimo, para probar la hipbtesis de la interaccibn 
H o :a 0 = 0, se usaria 


F = 
r 0 


MS ^ 

ms £ 


que tiene la distribucibn de referenda F (a _ 1)(6 _ 1}i ab(n _ 1} . 

En el modelo mixto es posible estimar los efectos del factor fijo como 

U = y... 


^ = y,..-y... 


i = l,2,...,a 


(12-24) 
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Los componentes de la varianza o 2 ^,a 2 zp ye 2 pueden estimarse aplicando el m£todo del analisis de varian- 
za. A1 eliminar la primera ecuacion de las ecuaciones 12-23 quedan tres ecuaciones con tres incognitas, 
cuyas soluciones son 

&2 _ ms b — ms e 

* an (12-25) 

MS^-MS, 
o r „ = 

r/S n 

y 

a 2 = MS e 

Este enfoque general puede emplearse para estimar los componentes de la varianza en cualquier modelo 
mixto. Despues de e liminar los cuadrados medios que contienen factores fijos, siempre quedara un siste- 
ma de ecuaciones que puede resolverse para los componentes de la varianza. 

En los modelos mixtos, el experimentador puede tener interes en probar hipotesis o en construir in- 
tervalos de confianza para las medias de tratamientos individuates del factor fijo. A1 utilizar estos proce- 
dimientos, deberd tenerse cuidado de usar el error est&ndar apropiado de la media de los tratamientos. El 
error estdndar de la media de los tratamientos del efecto fijo es 


Cuadrado medio para probar el efecto fijo 

t3 

1 

1 

Numero de observaciones en la media de cada tratamiento_ 

V bn 


Observe que esto es simplemente el error est&ndar que se usarfa si 6ste fuera un modelo con efectos fijos, 
salvo porque MS E se ha reemplazado con el cuadrado medio que se uso en la prueba de la hipotesis. 


EJEMPLO 12-3 

Retomando el experimento de la capacidad o aptitud del sistema de medicidn 

Considere de nuevo el experimento R&R del calibrador descrito en el ejemplo 12-2. Suponga ahora que 
solo tres operadores usan este calibrador, de tal modo que los operadores son un factor fijo. Sin embargo, 
puesto que las piezas se eligen al azar, se trata ahora de un experimento con un modelo mixto. 

El analisis de varianza del modelo mixto se muestra en la tabla 12-6. Los c&lculos se realizaron utili- 
zando la rutina Balanced ANOVA (an&lisis de varianza balanceado) de Minitab. Se especifico el uso del 
modelo restringido en el analisis de Minitab, el cual generd tambien los cuadrados medios esperados para 
este modelo. En la salida de Minitab, la cantidad Q[2] indica una expresion cuadratica que incluye al ope- 
rador del efecto de factor fijo. Es decir, Q[ 2] = S^/5 2 /(b- 1). Las conclusiones son similares al ejemplo 
12-2. Los componentes de la varianza pueden estimarse con la ecuacion 12-25 como 

M5 Piems - MS e 62.39- 0.99 
an (3)(2) 

Piezas x operadores -MS e _ 0,71-0.99 

n 2 

MS e = 0.99 

Estos resultados tambien se muestran en la salida de Minitab. De nueva cuenta, resulta una estimacion 
negativa del componente de la varianza de la interaccidn. Un curso de accidn apropiado seria ajustar un 
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modelo reducido, como se hizo en el ejemplo 12-2. En el caso de un modelo mixto con dos factores, esto 
lleva a los mismos resultados del ejemplo 12-2. 


Modelos mixtos alteraativos 

Se han propuesto varias versiones diferentes del modelo mixto. Estos modelos difieren de la versidn res- 
tringida del modelo mixto estudiado anteriormente en los supuestos establecidos acerca de los compo- 
nentes aleatorios. A continuacidn se revisa brevemente uno de estos modelos altemativos. 
Considere el modelo 


y#=A*+«i+yy+(«y)*+«ifc 

donde a t (i = 1, 2, ..., a) son efectos fijos tales que 2? =1 a,. = Oyy,-, son variables aleatorias no co- 

rrelacionadas que tienen media cero y varianzas V(yi) = o 2 , ^ / [( a Y)ij\ = o 1 ^ y V(e iJk ) = a 2 . Observe que 
aquf no se usa la restricci6n impuesta anteriormente sobre el efecto de la interaccion; por consiguiente, a 
esta versidn del modelo mixto se le llama con frecuencia modelo mixto no restringido. 

Es posible demostrar que los cuadrados medios esperados para este modelo son (referirse al material 
suplementario del texto de este capftulo) 

fenj o* 

E(MS a ) = a 2 +noly + ^ 

E(MS B )= a 2 +no 2 ay +ano 2 y 

E(MS ab ) « o 2 +nal / (12-26) 


y 


E(MS e ) = o 2 


Al comparar estos cuadrados medios esperados con los de la ecuacidn 12-23, se observa que la unica dife- 
rencia evidente es la presencia del componente de la varianza a ^ en el cuadrado medio esperado del 
efecto aleatorio. (En realidad, hay otras diferencias debido a las definiciones diferentes de la varianza del 
efecto de la interaccion en los dos modelos.) Por consiguiente, se probaria la hipotesis de que el compo- 
nente de la varianza del efecto aleatorio es igual a cero (H 0 :a 2 ay = 0) usando el estadistico 

F 

° ■ MS^ 


en contraste con probar H 0 : a ^ con F 0 = MS B /MS E en el modelo restringido. La prueba debera ser mas 
conservadora cuando se emplee este modelo porque por lo general MS AB ser£ mayor que MS E . 

Los par&metros de los dos modelos guardan una relation cercana. De hecho, puede demostrarse que 

Pi = Yj +(«y)j 

00)# = (ay), +(ay).; 


y 




a 


2 

ay 
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Puede usarse el metodo del an£lisis de varianza para estimar los componentes de la varianza. Con re- 
ferenda a los cuadrados medios esperados, se encuentra que el unico cambio de las ecuadones 12-25 es 
que 


d 


2 

r 


MS b -MS m 

an 


(12-27) 


Estos dos modelos son casos espedales del modelo mixto propuesto por Scheffe [98b, d]. En este mo- 
delo se supone que las observaciones pueden representarse con 




i = l,2,..„ a 
7 = 1 , 2 ,...,* 
k = 1,2,...,m 


donde m tj y e ljk son variables aleatorias independientes. La estructura de /n tJ es 

=fi+T i +b j +c ij 
E(m ij ) = /4+r i 



y 

Cj = 0 7 = 1,2,...,* 

Las varianzas y covarianzas de *, y c tj se expresan a travbs de las covarianzas de las m tj . Adem&s, los part- 
metros de los efectos aleatorios en otras formuladones del modelo mixto pueden relacionarse con * ; y c t> . 
El an&lisis estadfstico del modelo de Scheffe es identico al del modelo restringido tratado aquf, salvo por- 
que, en general, el estadfstico MSJMS^ no siempre se distribuye como F cuando H 0 : r, = 0 es verdadera. 

A la luz de esta multiplicidad de modelos mixtos, una pregunta 16gica es: iqu6 modelo debera usarse? 
La mayorfa de los espedalistas en estadfstica prefieren el modelo restringido, mismo que se encuentra 
con mayor frecuencia en la literatura del tema. El modelo restringido es en realidad un poco mas general 
que el no restringido, ya que en el primero la covarianza entre dos observaciones del mismo nivel del fac- 
tor aleatorio puede ser positiva o negativa, mientras que en el segundo esta covarianza solo puede ser po- 
sitiva. Si la estructura correlativa de los componentes aleatorios no es grande, entonces cualquiera de los 
dos modelos mixtos es apropiado, y solo hay diferencias menores entre ellos. Cuando se haga referencia 
m&s adelante a los modelos mixtos, se supondrt la estructura del modelo restringido. Sin embargo, si hay 
correlaciones grandes en los datos, entonces quiza deba emplearse el modelo de Scheffe. La elecci6n del 
modelo debert ser siempre dictada por los datos. El artfculo de Hocking [56] es un resumen claro de dife- 
rentes modelos mixtos. 


EJEMPLO 12*4 

El modelo no restringido 

Algunos paquetes de software de computadora tienen soporte para un solo modelo mixto. Minitab sopor- 
ta tanto el modelo restringido como el no restringido, aun cuando la seleccion por omisibn es el modelo 
no restringido. En la tabla 12-7 se muestra la salida de Minitab para el experimento del ejemplo 12-3 utili- 
zando el modelo no restringido. Observe que los cuadrados medios esperados concuerdan con los de la 
ecuacibn 12-26. Las conclusiones son idbnticas a las del analisis del modelo restringido, y las estimaciones 
de los componentes de la varianza son muy similares. 
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12-4 DETERMINACION DEL TAMANO DE LA MUESTRA 
CON EFECTOS ALEATORIOS 


Pueden usarse las curvas de operaci6n caracteristica del apdndice para determinar el tamano de la mues- 
tra en experimentos con factores aleatorios. Se empieza con el modelo de efectos aleatorios con un solo 
factor de la seccidn 12-1. La probabilidad del error tipo II para el modelo de efectos aleatorios es 

>3=1 — /’{Rechazar H a \ H 0 es falsa} 

= l-P{F 0 >F a ^ hN _ a \o 2 r >0} (12-28) 


De nueva cuenta se requiere la distribuci6n del estadistico de prueba F 0 = bajo la hipd- 

tesis altemativa. Puede demostrarse que si H l es verdadera (a \ > 0), la distribucidn de F 0 es F central con 
a - 1 y N - a grados de libertad. 

Puesto que la probabilidad del error tipo II del modelo de efectos aleatorios se basa en la distribucidn 
F central usual, podrian usarse las tablas de la distribucidn F del ap6ndice para evaluar la ecuacibn 12-28. 
Sin embargo, es mas simple determinar la sensibilidad de la prueba mediante el uso de las curvas de ope- 
ration caracteristica. En la parte IV del ap^ndice se presenta una serie de estas curvas para varios valores 
de los grados de libertad del numerador, de los grados de libertad del denominador y a de 0.05 y 0.01, En 
estas curvas se grafica la probabilidad del error tipo II contra el par£metro A, donde 



(12-29) 


Observe que A incluye dos parametros desconocidos, cF y a] . Quiza pueda estimarse a] si se tiene una 
idea acerca de cu£nta variabilidad de la poblacidn de tratamientos es importante detectar. Puede esco- 
gerse una estimation de a 2 recurriendo a la experiencia previa o discrecionalmente. En ocasiones es util 
definir el valor de a ] que quiere detectarse en t^rminos del cociente a ] /o 2 . 


EJEMPLO 12-5 

Suponga que se han seleccionado cinco tratamientos al azar con seis observations por tratamiento y que 
a = 0.05, y quiere determinarse la potencia de la prueba cuando a ) es igual a a 2 . Puesto que a = 5, n = 6 y 
o] = o 2 , puede calcularse 

A = Vl + 6(1) = 2,646 

Por la curva de operacidn caracteristica con a-1 = 4,N-a = 25 grados de libertad y a = 0.05, se encuen- 
tra que 

/S- 0.20 

y por lo tanto la potencia es de aproximadamente 0.80. 


Tkmbi^n puede usarse el incremento porcentual en la desviacibn est^ndar de un m6todo de observa- 
ci6n para determinar el tamano de la muestra. Si los tratamientos son homog£neos, entonces la desvia- 
ci6n est&ndar de una observation seleccionada al azar es a. Sin embargo, si los tratamientos son 
diferentes, la desviacidn estandar de una observacidn elegida al azar es 
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SiPes el incremento porcentual fijo en la desviaci6n estindar de una observation m<is alia del cual se de- 
sea rechazar la hipdtesis nula, entonces 


Vg 2 +^r 

a 


= 1 + 0.01P 


o 

2 

—rr = (1 + 0.01P) 2 — 1 

o l 


Por lo tanto, utilizando la ecuacidn 12-29 ? se encuentra que 

A = ]] 1 + r rr “ fi+rfci+tioiP ) 2 - 1] (12-30) 

Para una/* dada pueden usarse las curvas de operacidn caracteristica de la parte VI del apendice para en- 
contrar el tamano de la muestra deseado. 

T&mbidn pueden usarse las curvas de operacidn caracteristica para determinar el tamano de la mues- 
tra del modelo de efectos aleatorios con dos factoresy del modelo mixto. Se utiliza la parte VI del ap6ndi- 
ce para el modelo de efectos aleatorios. El par&metro A, los grados de libertad del numerador y los grados 
de libertad del denominador se muestran en la mitad superior de la tabla 12-8. Para el modelo mixto de- 
ben usarse las partes Vy VI del apendice. Los valbres apropiados de <P 2 y A se muestran en la mitad infe- 
rior de la tabla 12-8. 


Tabla 1 2-8 Par&metros de las curvas de operacidn caracteristica de las tablas V y VI del apendice para los modelos con dos 
factores de efectos aleatorios y mixto 


El modelo de efectos aleatorios 

Factor 

A 

Grados de 
libertad del 
numerador 

Grados de 
libertad del 
denominador 

^ \ 

fl bnal 

a -1 


B i 

o' + no], 

b- 1 



AB 



(«-l)<6-l) 


ab(n - 1 ) 


El modelo mixto 


Factor 

Parametro 

Grados de libertad 
del numerador 

Grados de libertad 
del denominador 

Parte del 
ap6ndice 

A (fijo) 


bn^ if 

t-1 

a- 1 

(a- 1X6-1) 

V 

a[o 2 + na^] 



B (aleatorio) 


f ano\ 

1+ o 2 

b-1 

ab(n - 1) 

VI 

AB 

A = ^ 


(«- 1X6-1) 

ab(n - 1) 

VI 
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12.5 REGLAS PARA LOS CUADRADOS MEDIOS ESPERADOS 


Una parte importante de cualquier problema de diseno experimental es la realizacidn del analisis de va- 
rianza. Esto implica determinar la suma de cuadrados de cada componente del modelo y el numero de 
grados de libertad asociados con cada suma de cuadrados. Despu6s, para construir los estadisticos de prueba 
apropiados, deben determinarse los cuadrados medios esperados, En situaciones de diseno complejas, 
particularmente las que incluyen modelos aleatorios o mixtos, con frecuencia es util contar con un proce- 
dimiento formal para este proceso. 

Se presentara un conjunto de reglas para anotar los cuadrados medios esperados en cualquier experi- 
mento factorial balanceado, anidado 2 o factorial anidado. (Observe que los arreglos parcialmente balan- 
ceados, como los cuadrados latinos y los disenos de bloques incompletos, se excluyen expllcitamente.) 
Estas reglas son estudiadas por varios autores, incluyendo Scheff6 [98d], Bennett y Franklin [9], Cornfield 
y lUkey [34] y Searle [99a, b]. Mediante el examen de los cuadrados medios esperados puede desarrollar- 
se el estadistico apropiado para probar hipdtesis acerca de cualquier pariimetro del modelo. El estadisti- 
co de prueba es el cociente de los cuadrados medios que se elige, de tal modo que el valor esperado del 
cuadrado medio del numerador difiere del valor esperado del cuadrado medio del denominador unica- 
mente por el componente de la varianza o el factor fijo en el que se tiene interes. 

Siempre es posible determinar los cuadrados medios esperados de cualquier modelo como se hizo en 
el capitulo 3, es decir, mediante la aplicacidn directa del operador valor esperado. Este m6todo de fuerza 
bruta, como suele llam£rsele, puede ser muy laborioso. Las reglas que se presentan a continuacidn pro- 
ducen siempre los cuadrados medios esperados sin recurrir al enfoque de fuerza bruta y, con la practica, 
su uso se vuelve relativamente simple. Cuando se aplican a un modelo mixto, estas reglas producen cua- 
drados medios esperados que son consistentes con los supuestos del modelo mixto restringido de la sec- 
ci6n 12-3, Las reglas se ilustran utilizando el modelo factorial de efectos fijos con dos factores. 


Regia 2, El termino del error del modelo, se escribe como % ii)m , donde el subindice m denota el 
subindice de la rdplica. Para el modelo con dos factores, esta regia implica que e ijk se convierte en e {ij)k . 


Regia 2* Ademls de una media global (u) y un tdrmino del error [£ (z) )m ], el modelo contiene todos los 
efectos principals y las interacciones cuya existencia supone el experimentador. Si existen todas las in- 
teracciones posibles entre los k factores, entonces hay ( * ) interacciones de dos factores, ( * ) interacciones 
de tres factores, 1 interaccion de k factores. Si uno de los factores de un termino aparece entre par^nte- 
sis, entonces no hay interaccidn entre ese factor y los dem£s factores de ese termino. 


Regia 3, Para cada t6rmino del modelo, los subindices se dividen en tres clases: a ) vivos: aquellos que es- 
t^n presentes en el termino y no estan entre par6ntesis; b) muertos: aquellos que est&n presentes en el ter- 
mino y est&n entre par£ntesis; y c) ausentes: aquellos subindices que est&n presentes en el modelo pero no 
en ese termino particular. 

Por lo tanto, en (r/J) /y , * y ) son subindices vivos y k es un subindice ausente, y en e {ij)ki k es un subindice 
vivo, mientras que i y j son subindices muertos. 


2 Los diseftos anidados se estudian en el capitulo 13. 
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Regia 4 * Grados de libertad. El numero de grados de libertad de cualquier t6rmino del modelo es el pro- 
ducto del numero de niveles asociados con cada subindice muerto y el numero de niveles asociados con 
cada subindice vivo menos 1. 

Por ejemplo, el numero de grados de libertad asociados con (r/i)^ es (a - 1 )(b - 1), y el numero de gra- 
dos de libertad asociados con e mk es ab(n - 1 ). 

Regia 5. Cada tSrmino del modelo tiene asociado con 61 un componente de la varianza (efecto aleato- 
rio) o bien un factor fijo (efecto fijo). Si una interaccidn contiene al menos un efecto aleatorio, la interac- 
tion completa se considera aleatoria. Un componente de la varianza tiene letras griegas como subindices 
para identificar el efecto aleatorio particular. For lo tanto, en un modelo mixto de dos factores con el fac- 
tory! fijo y el factor B aleatorio, el componente de la varianza de B es o 2 ^ , y el componente de la varianza 
de AB es , Un efecto fijo se representa siempre por la suma de cuadrados de los componentes del mo- 
delo asociados con ese factor dividida por sus grados de libertad. En el ejemplo tratado aqui, el efecto de 
A es 

a 

f = l 

a — 1 

Regia 6 . Cuadrados medios esperados . Para obtener los cuadrados medios esperados, se elabora la tabla 
siguiente. Hay un renglon para cada componente (cuadrado medio) del modelo y una columna para cada 
subindice. Arriba de cada subindice se escribe el numero de niveles del factor asociados con ese subindice 
y si el factor es fijo ( F ) o aleatorio ( R ). Las replicas siempre se consideran aleatorias. 

a) En cada renglon se escribe 1 si uno de los subindices muertos en el componente del renglon coin- 
cide con el subindice de la columna: 



F 

F 

R 


a 

b 

n 

Factor 

i 

j 

k 





a 




£m 

1 

1 



b) En cada rengldn, si cualquiera de los subindices del componente del mismo coincide con el sub- 
indice de la columna, se escribe 0 si el encabezado de la columna es un factor fijo y 1 si es un fac- 
tor aleatorio: 



F 

F 

R 


a 

b 

n 

Factor 

i 

j 

k 

*,■ 

0 



ft 


0 


m, 

0 

0 




1 

1 

1 
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c) En las posiciones del renglon que quedan vacias se escribe el numero de niveles que aparecen in- 
dicados arriba del encabezado de la columna: 



F 

F 

R 


a 

b 

n 

Factor 

i 

j 

k 

r, 

0 

b 

n 

Pi 

a 

0 

n 

m 

0 

0 

n 



1 

1 

1 


d) Para obtener los cuadrados medios esperados de cualquier componente del modelo, primero se 
cubren todas las columnas cuyos encabezados sean subindices vivos de ese componente. Des- 
pu6s, en cada rengldn que contiene al menos los mismos subindices que los del componente bajo 
consideracidn, se toma el producto de los numeros visibles y se multiplica por el factor fijo o alea- 
torio apropiado de la regia 1. La suma de estas cantidades es el cuadrado medio esperado del 
componente del modelo bajo consideracidn. Por ejemplo, para encontrarEfMS^), se cubre la co- 
lumna i. El producto de los numeros visibles en los renglones que contienen al menos el subindi* 
ce i son bn (rengldn 1), 0 (rengldn 3) y 1 (renglon 4). Observe que i no esta presente en el renglon 
2. Por lo tanto, el cuadrado medio esperado es 

E(MS A ) = a 1 +-^ r - 

En la tabla 12-9 se presenta la tabla completa de los cuadrados medios esperados para este diseno. En 
las tablas 12-10 y 12-11 se muestran las derivaciones de los cuadrados medios esperados para los modelos 
con dos factores, aleatorio y mixto, respectivamente. Observe que se ha supuesto la versidn restringida 
del modelo mixto para producir los cuadrados medios esperados. En el ejemplo siguiente se considera un 
diseno factorial con tres factores. 

EJEMPLO 

Considere un experimento factorial de tres factores con a niveles del factor^, b niveles del factor B, c ni- 
veles del factor Cyn replicas. El analisis de este diseno, suponiendo que todos los factores son de efectos 


Tabla 12-9 Derivaci6n de los cuadrados medios esperados, modelo de 



efectos fijos 

con dos factores 




F 

F 

R 



a 

b 

n 

Cuadrado 

Factor 

i 

j 

k 

medio esperado 


0 

b 

n 

, bnSi t 2 

a 2 + 

a — 1 

8, 

d 

0 

M 


rj 



+ b - 1 

m 

0 

0 

n 


E jm 

i 

1 

1 

cr 
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Tabla 12-10 Derivaci6n de Ids cuadrados medios esperados, modelo de 
efectos aleatorios con dos factores 



R 

R 

R 



a 

b 

n 

Cuadrado 

Factor 

i 

J 

k 

medio esperado 


1 

b 

n 

a 2 + no 2 x p + bno] 

p, 

a 

1 

n 

a 1 + no 2 t0 + ano\ 


1 

1 

n 

a 1 + no 2 t0 

£ m 

1 

1 

1 

a 1 


Tabla 12-11 

Derivacidn de los cuadrados medios 
mixto con dos factores 

esperados, modelo 


F 

R 

R 



a 

b 

n 

Cuadrado 

Factor 

i 

j 

k 

medio esperado 







0 

b 

n 

a 2 + no^+ a _‘ 

Pi 

a 

1 

n 

a 2 + ano 2 p 

m, 

0 

1 

n 

o 1 + na\ p 



1 

1 

1 

a 2 


Tabla 12-12 Derivacidn de los cuadrados medios esperados, modelo de 
efectos aleatorios con tres factores 



R 

R 

R 

R 



a 

b 

c 

n 

Cuadrado 

Factor 

i 

j 

k 

l 

medio esperado 


1 

b 

c 

n 

u 2 + cna 2 T0 + bnoly + no ^ + bcno 2 

Pi 

a 

1 

c 

n 

a 2 + cno 2 x0 + ano 2 ^ + na x0y + acno 2 0 

Yk 

a 

b 

1 

n 

a 2 + bna * + ano 2 ^ + no + abno 2 

m 

1 

1 

c 

n 

<t 2 H -no^ + cno^ 

(*y)* 

1 

b 

1 

n 

o 2 + no 2 fo + bno 2 ^ 

(Prh 

a 

1 

1 

n 

o 2 + no 2 ^ + ano\ 

( T PY)ak 

1 

1 

1 

n 

o 2 + no\ 

£ ijkl 

1 

1 

1 

1 

o 1 
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fijos, se presenta en la secckm 5-4. Ahora se determinan los cuadrados medios esperados suponiendo que 
todos los factores son aleatorios. El modelo estadistico apropiado es 

y& = /*+*.• +Pj +Yk Hrfh HtY)* H0y)jk +( t Py)» +«*« 

Utilizando las reglas descritas antes, en la tabla 12-12 se derivan los cuadrados medios esperados. 

Se observa, al examinar los cuadrados medios esperados de la tabla 12-12, que siv4, B y C son factores 
aleatorios, entonces no existe ninguna prueba exacta para los efectos principals. Es decir, si se quiere 
probar la hipdtesis a] = 0, no es posible formar un cociente de dos cuadrados medios esperados tal que el 
unico termino del numerador que no esti en el denominador sea bcna \ . El mismo fenomeno ocurre para 
los efectos principales de B y C. Observe que efectivamente existen las pruebas apropiadas para las in- 
teracciones de dos y tres factores. Sin embargo, es posible que las pruebas de los efectos principales sean 
de importancia basica para el experimentador. Por lo tanto, icdmo deberdn probarse los efectos principa- 
les? Este problema se considera en la siguiente seccidn. 


12-6 PRUEBAS F APROXIMADAS 

Es frecuente que en experimentos factoriales con tres o mas factores incluidos en un modelo aleatorio o 
mixto, asi corao en otros disenos mas complejos, no exista un estadistico de prueba exacto para ciertos 
efectos de los modelos. Una posible solution a este dilema es suponer que ciertas interacciones son insig- 
nificantes. Para ilustrar, si fuera razonable suponer que todas las interacciones de dos factores del ejem- 
plo 12-6 son insignificantes, entonces podria hacerse a\ p = = 0, y seria posible conducir 

pruebas de los efectos principales. 

Aun cuando parece tratarse de una posibilidad atractiva, es necesario senalar que debe haber algo en 
la naturaleza del proceso — o algun conocimiento previo sdlido — que permita suponer que una o mas de 
las interacciones son insignificantes. En general, no es sencillo establecer este supuesto, y tampoco debe- 
ra hacerse a la ligera. No deberdn eliminarse ciertas interacciones del modelo sin evidencia concluyente 
de que es apropiado hacerlo. Un procedimiento defendido por algunos experimentadores es probar pri- 
mero las interacciones, despu6s fijar en cero aquellas interacciones que se hayan encontrado no significa- 
tivas, para despuds suponer que estas interacciones son cero cuando se prueben otros efectos en el mismo 
experimento. Aun cuando en ocasiones se aplica en la practica, este procedimiento puede ser riesgoso, ya 
que cualquier decision respecto a una interaction esta sujeta tanto al error tipo I como al error tipo II. 

Una variante de esta idea es agrupar ciertos cuadrados medios en el an&lisis de varianza para obtener 
una estimation del error con mas grados de libertad. Por ejemplo, suponga que en el ejemplo 12-6 no fue 
significativo el estadistico de prueba F 0 = MS^JMSe. Por lo tanto, H 0 :o 2 ^ = 0 no se rechaza, y tanto 
MSmc como MS e estiman la varianza del error o 2 . El experimentador podria considerar la agrupaci6n o 
combinacion de MS AIIC y MS E de acuerdo con 

m _ abc(n—l)MSg +(q-l)(fc-l)( c -i)M^ i , c 
E ' ubc(n- l)+(u- l)(ft- l)(c- 1) 

de tal modo que E(MS e ) = o 2 . Observe que MS h tiene abc(n - 1 ) + (a -l)(b-l)(c-l) grados de libertad, 
en comparacidn con los abc(n - 1) grados de libertad del MS E original. 

El riesgo de agrupar es que puede incurrirse en un error tipo II y combinar con el error el cuadrado 
medio de un factor que en realidad es significativo, obtenidndose asi un nuevo cuadrado medio residual 
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(MS e ) que es muy grande. Esto hara que sea mas dificil detectar otros efectos significativos. Por otra par- 
te, si el cuadrado medio del error original tiene un numero muy pequeno de grados de libertad (por ejem- 
plo, menos de seis), el experimentador quiza tenga mucho que ganar al hacer la agrupacion, ya que podrfa 
conseguirse as! un incremento potencialmente considerable de la precisidn de pruebas posteriores. Un 
procedimiento razonablemente practice es el siguiente. Si el cuadrado medio del error original tiene seis 
o mas grados de libertad, no hacer la agrupacidn. Si el cuadrado medio del error original tiene menos de 
seis grados de libertad, hacer la agrupacion solo si el estadlstico F del cuadrado medio que se agrupara no 
es significativo para un valor grande de a, tal como a = 0.25. 

Cuando no es posible suponer que ciertas interacciones son insignificantes y sigue siendo necesario 
hacer inferencias acerca de los efectos para los que no existen pruebas exactas, puede emplearse un pro- 
cedimiento atribuido a Satterthwaite [97]. El mdtodo de Satterthwaite utiliza combinaciones lineales de 
cuadrados medios, por ejemplo, 

MS' = MS r + -+MS s (12-31) 


y 


MS" = MS U + -+MS V 


(12-32) 


donde los cuadrados medios de las ecuaciones 12-31 y 12-32 se seleccionan de tal modo que E(MS') - 
E(MS") sea igual a un multiplo del efecto (el parametro del modelo o el componente de la varianza) con- 
siderado en la hipotesis nula. Entonces el estadlstico de prueba serfa 


MS' 

MS" 


(12-33) 


que se distribuye aproximadamente como F p q . donde 

( MS r +-+MS ,) 2 
P ~ MS? I f r + -+MS 2 s /f s 


(12-34) 


y 


(M5 U + -+M5„) 2 
MS? //J I- MS? / /„ 


(12-35) 


En p y q,fi es el numero de grados de libertad asociados con el cuadrado medio MS t . No existe la seguridad 
de que pyq sean enteros, por lo que puede ser necesario hacer una interpolacidn en las tablas de la distri- 
bucidnf. Por ejemplo, en el modelo de efectos aleatorios con tres factores (tabla 12-12), es relativamente 
sencillo ver que un estadlstico de prueba apropiado para H 0 :o \ = 0 serla F = MS' IMS", con 

MS'=MS a +MS abc 


y 


MS " = MS ^ + MS ac 

Los grados de libertad de F se calcularlan con las ecuaciones 12-34 y 12-35. 

La teorfa subyacente de esta prueba es que tanto el numerador como el denominador del estadlstico 
de prueba (ecuacion 12-33) se distribuyen aproximadamente como multiplos de variables aleatorias 
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ji-cuadrada, y puesto que no aparece ningun cuadrado medio en el numerador o el denominador de la 
ecuacidn 12-33, el numerador y el denominador son independientes. Por lo tanto, en la ecuacidn 12-33, F 
se distribuye aproximadamente comoF p r Satterthwaite hace hincapie en que deberi prestarse atencidn 
al aplicar el procedimiento cuando algunos de los cuadrados medios de MS' y MS" aparezcan con signos 
negativos. Gaylor y Hopper [48] reportan que si MS' = MS X -MS 2 , entonces la aproximacidn de Sattert- 
hwaite tiene una validez razonable si 


MS, 

MS 2 >F ^>h.h 


xF, 


0-30.A./2 


ysi /,s 100 y/ 2 > fJ2. 


EJEMPLO 12-7 

Se estudia la caida de la presidn medida en una valvula de expansion de una turbina. El ingeniero de dise- 
no considera que las variables importantes que influyen en las lecturas de la caida de la presidn son la 
temperatura del gas en la admision (A), el operador (B) y el mandmetro especifico que utiliza el operador 
(C). Estos tres factores se incluyen en un diseiio factorial, con la temperatura del gas fijay el operador y el 
manometro aleatorios. En la tabla 12-13 se muestran los datos codificados de dos replicas. El modelo li- 
neal de este diseno es 


yw - t* +T i +Pj +y k +(*P) t +0r)* HMjk +(^V +e ijkl 

donde r, es el efecto de la temperatura del gas (A), fy es el efecto del operador (B) y y k es el efecto del ma- 
nometro (C). 

El an&lisis de varianza se muestra en la tabla 12-14. Se ha agregado la columna titulada “Cuadrados 
medios esperados” a esta tabla, y las entradas de esta columna se derivan por los metodos estudiados en la 
seccidn 12-5. Por la columna Cuadrados medios esperados, se observa que existen pruebas exactas para 
todos los efectos esperados salvo el efecto principal^. En la tabla 12-14 se muestran los resultados de es- 
tas pruebas. Para probar el efecto de la temperatura del gas, o // 0 :r, = 0, podria usarse el estadfstico 

„ MS' 

~ MS" 


Tabla 12-13 Datos codificados de la cafda de la pre$i6n para el experimento de la turbina 


Man6metro 

(Q 

1 

2 


Tbmperatura del gas (A) 



60°F 




75°F 



90°F 



Operador (2?) 



Operador (B) 



Operador (B) 


1 

2 

3 

4 

1 

2 

3 

4 

1 

2 

3 

4 

-2 

0 

-1 

4 

14 

6 

1 

-7 

-8 

-2 

-1 

-2 

-3 

-9 

-8 

4 

14 

0 

2 

6 

-8 

20 

-2 

1 

-6 

-5 

-8 

“3 

22 

8 

6 

-5 

-8 

1 

-9 

-8 

4 

-1 

-2 

-7 

24 

6 

2 

2 

3 

-7 

-8 

3 

-1 

-4 

0 

-2 

20 

2 

3 

-5 

-2 

-1 

-4 

1 

-2 

-8 

-1 

4 

16 

0 
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-1 

-1 
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-7 
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donde 

MS'= MS a +MS abc 


y 


MS" = MS M +MS ac 


ya que 

bcnlx f 

E(MS )- E(MS ") = 

Para determinar el estadfstico de pnieba para if 0 :r, = 0, se calculan 

MS' = MS A +MS abc 

= 511.68+13.84 = 525.52 
MS" = MS^ +MS ac 

= 202.00 + 34.47 = 236.47 


y 


MS' _ 525.52 
MS" 236.47 


2.22 


Los grados de libertad de este estadfstico se encuentran con las ecuaciones 12-34 y 12-35 de la siguiente 
manera: 


(A/S^+MS ^) 2 
MS A 12+MS^c / 12 

(525.S2) 2 

(511.68) 2 /2+(13.84) 2 / 12 


2.11 “2 


y 

_ (MS^+MS ^) 2 
q MS^g / 6+MS ac / 4 

(236 .47) 2 - ?£ o~ 3 

(202. 00) 2 /6+(34,47) 2 / 4 

A1 compararF = 2.22conF 0 .os,2,g = 4.46, no puede rechazarse// 0 . El valor P aproximado es P- 0.17. 

La interaccidnAB, o temperatura-operador, es grande, y hay ciertos indicios de una interaccidn AC o 
temperatura-mandmetro. El andlisis gr^fico de las interaccionesytB yAC, ilustrado en la figura 12-2, indi- 
ca que el efecto de la temperatura puede ser grande cuando se usan el operador 1 y el mandmetro 3. Por lo 
tanto, parece posible que los efectos principales de la temperatura y el operador estdn enmascarados por 
la interaccidn AB grande. 


En la tabla 12-15 se presenta la salida de la rutina Balanced ANOVA (analisis de varianza balancea- 
do) de Minitab para el experimento del ejemplo 12-7. Se ha especificado el modelo restringido. Q[ 1] re- 
presenta el efecto fijo de la presidn del gas. Observe que las entradas de la tabla del an&lisis de varianza 
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Figura 12-2 Interacciones en el experimento de la calda de la preside. 


concuerdan en general con las de la tabla 12-14, salvo por la pruebaE de la temperatura del gas (factor^). 
Minitab indica que la prueba no es exacta (lo que se ve por los cuadrados medios esperados). La Prueba 
Sintetizada construida por Minitab es en realidad el procedimiento de Satterthwaite, pero usa un estadis- 
tico de prueba diferente del que se utilizd aqui. Observe que, por la salida de Minitab, el cuadrado medio 
del error para probar el factor A es 

(4)+(5)— 7= MS m +MS ac - MS abc 

cuyo valor esperado es 

£[( 4 )+( 5 )-( 7 )]= ° 2 +n ° 2 rfr +cna 2 ^ +v 2 +no\ 

+bno\-(o 2 +no 2 ^) 

= a 2 +na \ +cno 2 lfi +bno 2 ry 

que es un cuadrado medio del error apropiado para probar el efecto promedio deA. Esto es una muy bue- 
na ilustracion de que puede haber mas de una manera de construir los cuadrados medios sinteticos usa- 
dos en el procedimiento de Satterthwaite. Sin embargo, se preferirfa en general la combination lineal de 
los cuadrados medios que se seleccionaron, en lugar de la que eligio Minitab, ya que no incluye ningun 
cuadrado medio con signo negativo en las combinaciones lineales. 

El analisis del ejemplo 12-7, suponiendo el modelo no restringido, se presenta en la tabla 12-16. 
La diferencia principal con el modelo restringido es que ahora los valores esperados de los cuadrados me- 
dios de los tres efectos printipales son tales que no existe ninguna prueba exacta. En el modelo restringido, 
los dos efectos aleatorios promedio podrian probarse contra su interaction, pero ahora el cuadrado me- 
dio esperado de B incluye acr^, yao^yel cuadrado medio esperado de C incluye aa^yao^.De nueva 
cuenta, Minitab construye cuadrados medios sinteticos y prueba estos efectos con el procedimiento de 
Satterthwaite. Las conclusiones generales no son radicalmente diferentes del anOlisis del modelo restrin- 
gido, ademSs del cambio grande en la estimaci6n del componente de la varianza del operador. El modelo 
no restringido produce una estimation negativa de a ^ . Puesto que el factor manOmetro no es significativo 
en ninguno de los dos analisis, es posible que sea pertinente alguna reduction del modelo. 


labia 12-15 An£liss de varianza balanceado de Minit ab (Balanced ANOVA) del ejemplo 12-7, modeio restringido 
Analisis de varianza (disenos balanceados) 
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Source Error DF Error MS Synthesis of Error MS 

1 GasT 6.97 222.63 (4) + <5> - (7) 


Tabla 12-16 Analisis de varianza balanceado de Minitab (Balanced ANOVA) del ejemplo 12-7, modelo no restrmgido 
An&lisis de varianza (disenos balance ados) 


e 






CD ^ 

I- n (M K) 








r* v 








J= UC0-4- 

O <?r N 

US 






X 

X 

X 


UJ + + + 



CO 








£ 



CL*-nO©OOOn*-CO 


L J A 






N^-I^oaoooo 


0 ttstvtiA 



c. 



^SOO^OOON 


'h» ^ " -w' w 



o 



o o o o o o a 


0 NO NO oo 



^ /-s /"X 




to e 



t_ r- r- 





«- 4- + + 

CO "O 



LU v w 



U-OM vOO^Nin 


3 <U *"x /"s y-v y*x --x 



N+ — III 



ro o ia st in no 


0 , ^iA'00>4-ir\sO 



o 





co y v x^ x^ x^- x^ x^ 



✓"V y"V /"X 



(SI O o Nt fsj N O 


.r- CO nO nO nO CO nO 



0 LT\ NO NO 





C £- 



■i- V- xy V 





aj4-»+4- + + + + 



0 





<P </) 



V + + +■ 








JC 





t-r^r— r--i — r^i — i — 



+J #—x y"x y-x 



WOONOONrsto 


T3 Cwwwv 



C -a- xj- m 



E ^OM'OO 4 0^00>f 


to 3rofNjfMfNjr\j<NjrM 



>x V N^ ^ 





■h 



CO 





0O+ + + + + + + 






t- O hn hn t- rvi 


to c 






Irtr- CM 


(X‘r 



to ro no x4- 

OfOiO 




X tflOOCOCOOOCOOOCOcO 



ENOOIA 

CX 




LU ^x^wx^x-yx-yx^vv 



■ ■ * 





x^ 



t- ru ro tn 





Ly 



O rg oj in 



(ONOcuo^-or-^-ocvj 


O E 



t- nj cm 



(/)K)00t-O*00NtT-iAK) 


£- £_ * * -K |N-fx-|N -00 



u 

m r\j rvj 




t_ OJ 



LU 



MlONrM>vOOO 


Ui 4-* 


V) 




CVJM r fOONOMA 




4-* 




O ^ PsJ f- (\J ^ O' 


to ^ sfsfONCvNOKl 


V) 

u- N O 00 



r- 0" K) 


u C stsOinNr-oOO 


to 

O On O On 

v> 

a 



CD iA^-rOir>iniN-xj- 


H- 

■ ■ n 

<l> O T— T— 

o 



me - 



L sO N IA 

3 NO 

L. 



*r- O vt (\J r- f\J Kl hO r- 


■O 

O 


A 



fi- CL | 1 PO 1 Pd 



fi. 

<0 


u-c\lK)fSJNO^t*OfMNOi- 


CO E 


isi 

L. 

> 

£_ 

A rns 


> o 


*1— 

UJ 


o 



u 


to 


</> m '■a* m 

N*- 


■ 

0) 


a> 


— i 



4-> 

o 


J= 


to 

01 


(0 

3 


4-» 


> 

u 

<D 

CD 

to 

■ 

c 


0) 

c 

cn 

4-» 

(D 

■h» 

X 


-1 

(0 

3 

1 

CD * 

0 

to 




co 

Li. 

t- O £- 




0 )^ e s 

c_ 

ID 


O 3 0 

§— 

fi- 


a o) o o 

CO 

0> * 

+■» 

+J (0 4-* 


o 


X XT3T3 

> 

fi- CT> L. 

U 

co to to co 

TJ 

'4- 


»-•!- c c 


O 3 0 

(0 

fi- cn* E- 

<d 



*t- 0 «o 

4- 

V <0 -M 

X 

L. 0) 3 L 11 

hi 

(0 

E. 

u L 

O 

a 0) 0 eg 

to 

o a co o a 


E 

0 



c- Cft* C 


V O 0 -h O 

W 

fi- 

4-* 

c. 

to 

t- a> □ c- a) 

c 

co a* * * co * e- 

a> 

to 

co to 

o 

•r 

o a to o a 

<0 

1 — c- cn t- i- (- i- o 

-C 

h- 

1- E- O) 

L. -h» 

<0 

0) -M 0 0^0 


to miD3V)l/)Dl/)L 

4-1 


to co to 3 

O to a> 

X 

o cou**to*c-— * 

4-> 

O C0O.C0C0(0O*C0t- 

c 

u 

y co G. co 

+J|- L D) 


c- 1 — «- Oh- H LH O « 

o 

£_ 0O000O0UJ 


o 

L0O0 

O <rt CD 3 

CO 

3<flQ>30tf>aiV)fi-4-» 

z 

3 

<o 

u 

3 

<0 <0 Q. <0 

c 

OlQQlQQIOOilOtiO 


o ^-eupoxj-iANOiN-co 


fi- 

O f“ AJ K1 

IL o O 

< 

W0O000O0UJh 

X 

to 

* 

LU 

CO 


542 



12-7 ALGUNOS TEMAS ADICIONALES SOBRE LA ESTIMACl6N DE LOS COMPONENTES DE LA VARIANZA 543 


12-7 ALGUNOS TEMAS ADICIONALES SOBRE LA ESTIMACION DE LOS 
COMPONENTES DE LA VARIANZA 

Como se senal6 anteriormente, la estimacidn de los componentes de la varianza en un modelo aleatorio o 
mixto reviste con frecuencia considerable importancia para el experimentador, En esta seccibn se presen- 
tan algunos resultados y t6cnicas adicionales que son utiles para estimar los componentes de la varianza. 
La atencidn se centra en los procedimientos para encontrar intervalos de confianza para los componentes 
de la varianza, y se ilustra asimismo c6mo encontrar estimaciones de maxima verosimilitud de los compo- 
nentes de la varianza. El m6todo de maxima verosimilitud puede ser una altemativa util cuando el m6to- 
do del andlisis de varianza produce estimaciones negativas. 


12-7*1 Intervalos de confianza aproximados para los componentes de la varianza 


Cuando se introdujo el modelo de efectos aleatorios en la seccidn 12-1, se presentaron intervalos de con- 
fianza exactos de 100(1 - a) por ciento para o 2 y para otras funciones de los componentes de la varianza en 
ese diseno experimental simple. Siempre es posible encontrar un intervalo de confianza exacto para cual- 
quier funcidn de los componentes de la varianza que es el valor esperado de uno de los cuadrados medios 
del an£lisi$ de varianza. Por ejemplo, considere el cuadrado medio del error. Puesto que E(MS e ) = a 2 , 
siempre es posible encontrar un intervalo de confianza exacto para a 2 , ya que la cantidad 

f E MS E /a 2 =f E d 2 /a 2 


tiene una distribucidn ji-cuadrada con/ £ grados de libertad, El intervalo de confianza exacto de 100(1 - a) 
por ciento es 


f E MS E 2 f E MS e 

2 — — 2 

Xal2,f E Xl-a/2,f e 


(12-36) 


Desafortunadamente, en experimented m&s complejos en los que intervienen varios factores del dise- 
no no es posible por lo general encontrar intervalos de confianza exactos para los componentes de la va- 
rianza de interns, ya que estas varianzas no son el valor esperado de un solo cuadrado medio del an&lisis 
de varianza. Sin embargo, los conceptos fundamentales de las “pseudo” pruebas F aproximadas de Sat- 
terthwaite, introducidos en la seccidn 12-6, pueden emplearse para construir intervalos de confianza 
aproximados de los componentes de la varianza para los que no se cuenta con ningun intervalo de con- 
fianza exacto. 

Recuerde que el m£todo de Satterthwaite utiliza dos combinaciones lineales de cuadrados medios 

MS'=MS r + -+MS s 


y 


MS"=MS U + -+MS V 


con el estadfstico de prueba 


MS' 

MS" 


que tiene unadistribuddn^aproximada. A1 utilizar los grados de libertad apropiados para MS' y MS", de- 
finidos en las ecuadones 12-34 y 12-35, este estadfstico F puede usarse en una prueba de significacion 
aproximada del par&metro o del componente de la varianza de interns. 
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Para probar la signification de un componente de la varianza, por ejemplo las dos combinaciones 
lineales, MS' y MS", se eligen de tal modo que la diferencia en sus valores esperados sea igual a un multi- 
plo del componente, por ejemplo 


o 


E(MS')- E(MS")= ka 2 0 
2 E(MS')-E(MS") 


(12-37) 


La ecuacion 12-37 proporciona una base para una estimation puntual de a 2 : 

MS'- MS" 

° 0 ~ k 

= MS r + - +^MS s -i MS U - - \MS V (12-38) 


Los cuadrados medios (MS,) de la ecuacion 12-38 son independientes, donde las f-MSJo] = SSjo tienen 
distribuciones ji-cuadrada con/ grados de libertad. La estimation del componente de la varianza, o ; : , es 
una combination lineal de multiplos de los cuadrados medios, y sigue una distribution ji-cuadrada 

aproximada con r grados de libertad, donde 


r 


(W 


1 MS? 


1=1 K 
(MS r + 


f, 

+ MS-MS,, 


■MS U ) 2 


MS? 

fr 


MSI 


, MS? MS? ■ 

fs fu fv 


(12-39) 


Este resultado sblo puede usarse si >0. Como r no ser& un entero en la mayorfa de los casos, por lo ge- 
neral sera necesario hacer una interpolation de las tablas ji-cuadrada. Graybill [50] establece un resulta- 
do general para r. 

Ahora bien, puesto que rd^la 2 tiene una distribution ji-cuadrada aproximada con r grados de libertad, 


XI- 


r&l 


l-a/2,r 


X 


a/2,1- 


1 -a 


y 





< 



1— a 


Por lo tanto, un intervalo de confianza aproximado de 100(1 - a) por ciento para o\ es 


r&_ q 

X all,r 


- a o - ' 


rOn 


Xx- 


(12-40) 


l-a/2,r 


EJEMPLO 12-8 

Para ilustrar este procedimiento, considere nuevamente el experimento del ejemplo 12-7, donde se uso 
un modelo mixto con tres factores en un estudio de la caida de la presidn en una valvula de expansidn de 
una turbina. El modelo es 

y^id = E+t i +pj +Y k +(#)# +(*y)* +(M jk + ( r Py)ijk +*> 
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donde t, es un efecto fijo y todos los deni as efectos son aleatorios. Se encontrara un intervalo de confianza 
aproximado para a 2 x(s . A1 utilizar los cuadrados medios esperados de la tabla 12-14, se observa que la dife- 
rencia en los valores esperados de los cuadrados medios para el efecto de la interaction de dos factores 
AB y el efecto de interacckm de tres factores ABC es un multiplo del componente de la varianza de 
interns, a\ ? . 

e ( m Sab )“ e (MS abc ) = a 2 +na 2 rfif +cno 2 tp - (a 2 +na 2 ^ ) 

= cna% 


Por lo tanto, la estimacion puntual de a 2 0 es 

2 MS ab - MS^ = 134.91-19.26 _ 

* «* (3)(2) 

y 

r (MS m - MS^c ) 2 (134.91- 19.26) 2 

MS 2 m MS^c (134. 91) 2 (19.26) 2 

(a—l)(b~ l)(c- 1) (2)(3) (2)(3)(2) 


El intervalo de confianza aproximado de 95% para a 2 ^ se encuentra entonces con la ecuacion 12-40 de la 
siguiente manera: 


rdl 


X 0.025, r 




K 

X 0,975 ,r 


(4,36)(19.28) < (436)(19.2g) 

11.58 ^ ” 0.61 


7,26 saj <137.81 


Este resultado es consistente con los resultados de la prueba F exacta para <7^ , en que hay evidencia s61i- 
da de que este componente de la varianza es diferente de cero. 


12-7*2 Metodo de grandes muestras modificado 

El metodo de Satterthwaite de la seccion anterior es una forma relativamente simple de encontrar un in- 
tervalo de confianza aproximado para un componente de la varianza que puede expresarse como una 
combinacidn lineal de cuadrados medios, por ejemplo 

Q 

- 2 c.MSi (12-41) 


El m6todo de Satterthwaite funciona bien cuando los grados de libertad de cada cuadrado medio MS t son 
relativamente grandes, y cuando todas las constantes c t de la ecuacidn 12-41 son positivas. Sin embargo, 
en ocasiones algunas de las c, son negativas. Graybill y Wang [51] propusieron un procedimiento llamado 
m£todo de grandes muestras modificado, que puede ser una altemativa muy util del metodo de Sattert- 
hwaite. Si todas las constantes q de la ecuacidn 12-41 son positivas, entonces el intervalo de confianza mo- 
dificado de 100(1 - a) por ciento de una muestra grande para o\ es 


*-J2 G ^ MS > 


zo 2 0 <d 2 0 +. 


V 


2 c 2 MS 2 


(12-42) 
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donde 


G. = 1— - 


a,//,® 


H, = 


1 1 - 2 ,/;. 


— 1 


Observe que una variable aleatoria F con un numero i nf inito de grados de libertad en el denominador es 
equivalente a una variable aleatoria ji-cuadrada dividida por sus grados de libertad. 

Considere ahora el caso mas general de la ecuacidn 12-41, donde las constantes c, no tienen restric- 
ciones sobre el signo. Esto puede escribirse como 


Q 

1 

j=P + 1 


*o = £ c l MS i - 2 Cj MSj, Ci , Cj > 0 


(12-43) 


Ting, etal [110], dan un intervalo de confianza inferior aproximado de 100(1 - a) por ciento para < 7 ^ como 


donde 


L=&l-JK 


(12-44) 


i= 1 
P-1 P 


G?c?MS?+ X Hfc*MSf+2 % GqCjCjMSjMSj 

j=P+l 


P Q 

S 2 

/= i y=p + i 


-2 2 G^CjC'MSjMS, 


G, = 1— 




# = — 

P, 


— 1 


G * = 


G* = 




\ 2 


1- 


a , /,+/„» / 


a+/,r g//, g, /, 


/,/, /, /, 


(p~i), 


siP>l y G£ = 0 si P = 1 


Estos resultados tambi6n pueden extenderse para incluir intervalos de confianza aproximados para 
cocientes de componentes de la varianza. Para una relacidn completa de estos metodos, referirse al exce- 
lente libro de Burdick y Graybill [22]. 


EJEMPLO 12-9 

Parailustrar el mdtodo de grandes muestras modificado, considere nuevamente el modelo mixto con tres 
factores del ejemplo 12-7. Se encontrara un intervalo de confianza inferior aproximado de 95% para . 
Recuerde que la estimation puntual de es 


*2 _ MSab MSjxq 

a 't~ 


134.91-19.26 

(3)(2) 


= 19.28 
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Por lo tanto, en la notacibn de la ecuacibn 12-43, c, = c 2 = V 6 , y 


^ = 1--^— = 1-^7=0.524 

H 2 =—^~ 1 = 77777-1 = 1.30 

F n 0.435 


L 0.95,12,® 


Gj 2 — 


(Wu-1) -(fi ) - (#2 ) 


■* 0.05,6,12 

(100- l) 2 - (0.524) 2 (3.00) 2 - (1-3) 2 _ Q Q:4 


3.00 


Gi, = 0 


Por la ecuacibn 12-44 

V L = del MS +// 2 2 c 2 2 MS^ c + G 12 c x c 2 A/S^ MS abc 
= (0.524) 2 (1 / 6) 2 (134.91) 2 +(1.3) 2 (1 / 6) 2 (19.26) 2 
+(— 0.054)(1 / 6)(1 / 6)(134.91)(19.26) 

= 152.36 

Asi, un llmite de confianza inferior aproximado de 95% para es 

L=d\p- JV~ L = 19.28- V15236 = 6.94 

Este resultado es consistente con los resultados de la prueba F exacta para este efecto. 


12-7.3 Estimacion de mdxima verosimilitud de componentes de la varianza 

En este capitulo se ha subrayado el mbtodo del analisis de varianza para estimar los componentes de la 
varianza debido a que es relativamente directo y hace uso de cantidades familiares: los cuadrados medios 
de la tabla del analisis de varianza. Sin embargo, el mbtodo tiene ciertas desventajas, incluyendo la moles- 
ta tendencia a producir en ocasiones estimaciones negativas. Ademas, el metodo del analisis de varianza 
es en realidad un mbtodo de estimador de momentos, una tecnica que los especialistas en estadistica ma- 
tematica prefieren en general no usar para estimar parametros, debido a que resulta con frecuencia en es- 
timaciones de parametros que no tienen buenas propiedades estadisticas. A la tecnica de estimacibn de 
parametros preferida se le llama mbtodo de maxima verosimilitud. La implementacibn de este metodo 
puede ser un tanto complicada, en particular para el modelo de un diseiio experimental, pero en cierto 
sentido el mbtodo de maxima verosimilitud selecciona estimaciones de los parametros que, para un mo- 
delo y una distribucion del error especificados, maximiza la probabilidad de ocurrencia de los resultados 
muestrales. Una descripci6n general muy adecuada del mbtodo de maxima verosimilitud aplicado a mo- 
delos de disenos experimentales se ofrece en Milliken y Johnson (79]. 

La revisibn completa del mbtodo de maxima verosimilitud sale del alcance de este libro, pero la idea 
general puede ilustrarse con suma facilidad. Soponga quex es una variable aleatoria con una distribucion 
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de probabilidad/(x; 0), donde 6 es un par^metro desconocido. Seajt 1? x 2 , ...,x n una muestra aleatoria de n 
observations. Entonces la funcion de verosimilitud de la muestra es 

L(6)=f( x i; 9) -f(x 2 ;d) f(x n ; 6) 

Observe que ahora la funcidn de verosimilitud es una funcion unicamente del par&metro desconocido 0. 
El estimador de maxima verosimilitud de 6 es el valor de 6 que maximiza la funcion de verosimilitud L(8). 

Para ilustrar como se aplica esto en el modelo de un diseno experimental con efectos aleatorios, con- 
sidere un modelo de dos factores con a = b = n = 2. El modelo es 

V =t*+* i +P j +(*P) ii +£ifi 

con i = 1, 2, j = 1, 2 y k = 1, 2. La varianza de cualquier observation es 

y(y, k ) = o 2 y =a 2 t +a 2 fi +a%+a 2 

y las covarianzas son 

Cov(y ijk , y m .) = o] +a 2 t +a^ i = i', j = j',k*k' 

= °l i = (12-45) 

-Op i*i', j = j' 

= 0 i*i', j*j' 

Es conveniente consider ar las observaciones como un vector 8 x 1, es decir, 

ym 

3^112 
3^211 
v _ y 212 
3'l21 
3*122 

y 221 

_ 3 7 222 „ 


y las varianzas y covarianzas pueden expresarse como una matriz de covarianza 8x8 


y _ ^ll ^12 

S 22 J 


donde 2 n , Z 22 , S 12 y Z 21 = Z' 12 son matrices 4x4 definidas de la siguiente manera: 


o\ 

Ol +0\ +0 2 Tfi 

ol . 

ol 

a] +o) +a) p 


ol 

ol 

ol 

ol 

o] 

ol +0 2 f, +o 

o l 

ol 

ol +o\ +a% 



2 



0 

0 


0 

0 
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y 2 2 i es s61o la transpuesta de 2 12 . Entonces cada observation sigue una distribucidn normal con varianza 
o 2 , y si se supone que todas las A = abn observaciones tienen una distribution normal conjunta, entonces 
la funcion de verosimilitud del modelo aleatorio queda como 


L(/r, a 2 , a), o 2 ) = 


(2jt) W2 |2| 


•I 1/2 


exp 




donde j^es un vector N x 1 compuesto de unos. Las estimaciones de maxima verosimilitud de/i, a], a 2 ^, 
a 2 y a 2 son los valores de estos parametros que maximizan la funcion de verosimilitud. Tambien seria de- 
seable restringir las estimaciones de los componentes de la varianza a valores no negativos. Por lo tanto, 
en la practica la funcion de verosimilitud se maximizaria sujeta a esta restriction. 

La estimacion de los componentes de la varianza por el metodo de maxima verosimilitud requiere 
software de computadora especializado. Algunos paquetes de software de estadistica general cuentan 
con esta capacidad. El sistema SAS calcula estimaciones de maxima verosimilitud de los componentes de 
lavarianza de modelos aleatorios o mixtos con la rutina SAS PROC MIXED. Se ilustrara el uso de la ruti- 
na PROC MIXED aplicandola al modelo factorial de dos factores introducido en los ejemplos 12-2 y 
12-3. 

Considere primero el ejemplo 12-2. Se trata del modelo de un diseno factorial de efectos aleatorios 
con dos factores. El metodo del analisis de varianza ha producido una estimacion negativa del componen- 
te de la varianza de la interaction. Las estimaciones negativas de los componentes de la varianza pueden 
evitarse en la rutina PROC MIXED especificando el uso del metodo de maxima verosimilitud restringi- 
da (o residual) (REML, por sus siglas en ingles). En esencia, la REML restringe las estimaciones de los 
componentes de la varianza a valores no negativos. 

La rutina PROC MIXED del sistema SAS requiere como entrada la matriz de covarianza de los para- 
metros del modelo. La estructura de un modelo aleatorio en el que todas las variables aleatorias son mu- 
tuamente independientes es 


G = 


a r 2 I 

0 

0 


oil 


0 

0 


(12-46) 


donde las I son matrices identidad. (La estructura de la covarianza de un modelo puede especificarse en 
la rutina PROC MIXED con la opcidn TYPE = structure en el enunciado RANDOM.) La estructura de 
la covarianza del modelo del ejemplo 12-2 se especifica como TYPE = SIM (el valor por omisidn de 
PROC MIXED), que especifica la estructura simple de la covarianza para los parametros del modelo da- 
dos en la ecuatidn 12-46. 

En la tabla 12-17 se presenta la salida de la rutina PROC MIXED de SAS para el experimento del 
ejemplo 12-2. Se especificd el mtiodo de estimacion REML de los componentes de la varianza. La salida 
se ha anotado con numeros para facilitar la description que se presenta a continuation: 

1. Estimaciones de los componentes de la varianza y la salida relacionada. 

2. Par&metro covarianza. Identifica los parametros del modelo: o], a 2 , a 2 rfs y cr 2 . 

3. Cociente de la varianza estimada del efecto y la varianza estimada del error residual: 

d 2 /d 2 

4. Estimaciones de los parametros. Son las estimaciones REML de los componentes de la varianza 
o 2 , a 2 , o 2 j0 y a 2 . Observe que la estimacidn REML de o 2 r/} es cero. 


Tabla 12-17 Salida de PROC MIXED del sistema SAS del analisis del estudio de repetibilidad y reproductibilidad de instrumentos de medicion (calibradores) 
del_ejemp_lo_I2-2 utjlizando la estimacion REML de los componentes de varianza 

_ ~ The MIXED Procedure 
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Tabla 12-18 Salida de PROC MIXED del sistema SAS del an&lisis del estudio de repetibilidad y reproductibilidad de instrumentos de medicidn (calibradores) con el 
operador como efecto fijo utilizando la estimaci6n REML de los componentes de la varianza 
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5. Error estandar de la estim ation. E s el error estandar {se) para muestras grandes de la estimation 
del parametro: se(o] ) = 


6. El estadistico Z asotiado con la varianza estimada: 

Z = af /se(&f). 

7. Valor P del estadistico Z calculado. 

8. Nivel alfa usado para calcular el intervalo de confianza. 

9. Limites inferior y superior de un intervalo de confianza de la teoria normal para muestras gran- 
des de 100(1 - a) por ciento para los componentes de la varianza: 

L=o] -Z a/2 se(d 2 ) U- d] +Z an se(b]) 

10. Matriz asintotica de la covarianza de las estimaciones. Es la matriz de la covarianza para mues- 
tras grandes de las estimaciones de los componentes de la varianza. 

11. Medidas del ajuste del modelo para comparar el ajuste de modelos alternatives. 

Observe que los resultados de la rutina PROC MIXED de SAS coinciden muy de cerca con los valores pre- 
sentados en el ejemplo 12-2 cuando el modelo reducido (sin el termino de la interaction) se ajusto a los datos. 

En el ejemplo 12-3 se considero el mismo experimento, pero se supuso que los operadores eran un 
factor fijo, lo cual llevo a un modelo mixto. La rutina PROC MIXED de SAS puede emplearse para esti- 
mar los componentes de la varianza para esta situation. La estructura de la covarianza de las observatio- 
ns, suponiendo que todas las variables aleatorias son mutuamente independientes (es decir, el modelo 
mixto no restringido), es 

Cov(y.*, y.,., k , ) = a) +a^ +a 2 i = i j = j',k = k' 

= a] +a 2 ^ i = i', ; = k*k' (12-47) 

= 0 j*j' 


La matriz de la covarianza de los parametros del modelo es 


G = 


all 0 


0 




(12-48) 


(Esto se especifica en el enunciado TYPE = SIM en la entrada de la rutina PROC MIXED.) En la tabla 
12-18 se muestra la salida de la rutina PROC MIXED de SAS para la forma no restringida del modelo 
mixto del ejemplo 12-3. De nueva cuenta se selecciono el metodo REML. La estimacion del componente 
de la varianza para el factor “pieza” es muy similar a la estimacion que se obtuvo utilizando el modelo 
aleatorio. La estimacion de la varianza del error residual tambien es similar. Ademas, la salida incluye 
una prueba F para el efecto fijo. 


12-8 PROBLEMAS 

12-1. Una fabrica teyfil tiene un gran numero de telares. Se supone que cada telar produce la misma cantidad de 
tela por minuto. Para investigar este supuesto, se eligen cinco telares al azar y se registra su production en 
tiempos diferentes. Se obtienen los siguientes datos: 


Telar 


Producci6n (lb/min) 



1 

14.0 

14.1 

14.2 

14.0 

14.1 

2 

13.9 

13.8 

13.9 

14.0 

14.0 

3 

14.1 

14.2 

14.1 

14.0 

13.9 

4 

13.6 

13.8 

14.0 

13.9 

13.7 

5 

13.8 

13,6 

13.9 

13.8 

14.0 
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a) Explicar por qu£ este experiraento es de efectos aleatorios. 6Todos los telares tienen la misma produc* 
ci6n? Utilizar a = 0,05. 

b) Estimar la variabilidad entre los telares, 

c) Estimar la varianza del error experimental 

d) Encontrar un intervalo de confianza de 95% para a\ / + a 2 ) 

e) Analizar los residuales de este experimento, 6Considera el lector que se satisfacen los supuestos del ana- 
lisis de varianza? 

12-2. Un fabricante sospecha que los lotes de materia prima suministrados por su proveedor difieren de manera 
significativa en elcontenido de calcio. Hay un gran numero de lotes actualmente en el almac£n. Se seleccio- 
nan cinco de ellos para hacer un estudio. Un quimieo hace cinco determinaciones en cada lote y obtiene los 
siguientes datos: 


Lote 1 

Lote 2 

Lote 3 

Lote 4 

Lote 5 

23.46 

23.59 

23.51 

23.28 

23.29 

23.48 

23.46 

23.64 

23.40 

23.46 

23.56 

23.42 

23.46 

23.37 

23,37 

23.39 

23.49 

23.52 

23.46 

23.32 

23.40 

23.50 

23.49 

23,39 

23.38 


a) ^Existe una variacidn significativa en el contenido de calcio de un lote a otro? Utilizar a = 0,05. 

b) Estimar los componentes de la varianza. 

c) Encontrar un intervalo de confianza de 95% para o 2 r / (a] + o 2 \ 

d) Analizar los residuales de este experimento. 6Se satisfacen los supuestos del an&lisis de varianza? 
12-3. En una tebrica metalurgica se usan varios hornos para calentar ejemplares de metal. Se supone que todos los 

hornos operan a la misma temperatura, aunque se sospecha que quiz& no sea 6ste el caso. Se seleccionan al 
azar tres hornos y se registran sus temperaturas en cargas sucesivas. Los datos recabados son los siguientes; 


Homo 



TEmperatura 



1 

491.50 

498.30 

498.10 

493.50 

493.60 


2 

488.50 

484.65 

479.90 

477.35 



3 

490.10 

484.80 

488.25 

473.00 

471.85 

478.65 


a) 6Existe una variacidn significativa de la temperatura entre los hornos? Utilizar a = 0.05, 

b) Estimar los componentes de la varianza de este modelo. 

c) Analizar los residuales de este experimento y sacar conclusiones acerca de la adecuacidn del modelo. 
12-4. En un artfculo de Journal of the Electrochemical Society (vol. 139, no. 2, pp. 524-532) se describe un experi- 
mento para investigar la deposicidn de vapor a baja presi6n del polisilicio. El experimento se llevd a cabo en 
el reactor de alta capacidad de Sematech en Austin, Texas. El reactor tiene varias posiciones para las obleas, 
y se seleccionan al azar cuatro de estas posiciones. La variable de respuesta es la uniformidad del espesor de 
la pelicula. Se hicieron tres replicas del experimento y se obtuvieron los siguientes datos: 


Posicidn de la oblea 


Uniformidad 


1 

2,76 

5,67 

4.49 

2 

1.43 

1.70 

2.19 

3 

2.34 

1.97 

1,47 

4 

0,94 

1.36 

1.65 
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a ) 6Hay alguna diferencia en las posiciones de las obleas? Utilizar a = 0.05. 

b) Estimar la variabilidad debida a las posiciones de las obleas. 

c) Estimar el componente del error aleatorio. 

d) Analizar los residuales de este experimento y comentar la adecuacibn del modelo, 

12-5. Considere el experimento de la deposicibn de vapor del problema 12-4. 

a) Estimar la variabilidad total de la respuesta uniformidad. 

b) LQu6 parte de la variabilidad total de la respuesta uniformidad se debe a la diferencia entie las posicio- 
nes en el reactor? 

c) 6Hasta que nivel podria reducirse la variabilidad de la respuesta uniformidad si pudiera eliminarse la va- 
riabilidad entre una posicibn y otra en el reactor? oConsidera el lector que 6sta es una reduccibn signifi- 
cativa? 

12-6. En un articulo de Journal of Quality Technology (vol. 13, no. 2, pp^ 111-114) se describe un experimento para 
investigar los efectos de cuatro sustancias quimicas blanqueadoras sobre la brillantez de la pulpa. Estas cua- 
tro sustancias quimicas se seleccionaron al azar de una poblacion grande de agentes blanqueadores poten- 
tiates. Los datos son los siguientes: 


Sustancia quimica Brillantez de la pulpa 


1 

77.199 

74.466 

92.746 

76.208 

82.876 

2 

80.522 

79.306 

81.914 

80.346 

73.385 

3 

79.417 

78.017 

91.596 

80.802 

80.626 

4 

78,001 

78.358 

77.544 

77.364 

77.386 


a) 6Existe alguna diferencia en los tipos de sustancias quimicas? Utilizar a = 0.05. 

b) Estimar la variabilidad debida al tipo de sustancias quimicas. 

c) Estimar la variabilidad debida al error aleatorio. 

d) Analizar los residuales de este experimento y comentar la adecuacibn del modelo. 

12-7. Considere el modelo de efectos aleatorios, balanceado, en una variable. Desarrollar un procedimiento para 
encontrar un intervalo de confianza de 100(1 - a) por ciento para <7 2 /(<j* + a 2 ), 

12-8. Referirse al problema 12-1. 

a) 6Cudl es la probabilidad de aceptar H 0 si o 2 es 4 veces la varianza del error <7 2 ? 

b) Si la diferencia entre los telares es lo suficientemente grande para incrementar la desviacion est^ndar de 
una observacibn en 20%, quiere detectarse esto con una probabilidad de al menos 0.80. 6Que tamano de 
la muestra deberd usarse? 

12-9. Se llevb a cabo un experimento para investigar la capacidad o aptitud de un sistema de medicion. Se seleccio- 
naron diez piezas al azar, y dos operadores escogidos aleatoriamente midieron tres veces cada pieza. Las 
pruebas se hicieron en orden aleatorio y se obtuvieron los siguientes datos: 


Numero 
de pieza 

Mediciones del 
operador 1 

Mediciones del 
operador 2 

1 

2 

3 

1 

2 

3 

1 

50 

49 

50 

50 

48 

51 

2 

52 

52 

51 

51 

51 

51 

3 

53 

50 

50 

54 

52 

51 

4 

49 

51 

50 

48 

50 

51 

5 

48 

49 

48 

48 

49 

48 

6 

52 

50 

50 

52 

50 

50 

7 

51 

51 

51 

51 

50 

50 

8 

52 

50 

49 

53 

48 

50 

9 

50 

51 

50 

51 

48 

49 

10 

47 

46 

49 

46 

47 

48 
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a) Analizar los datos de este experimento. 

b) Encontrar estimaciones puntuales de los componentes de la varianza utilizando el m6todo del andlisis de 
varianza. 

12-10, Considere nuevamente los datos del problema 5-6. Suponga que ambos factores, las mdquinas y los operado- 
res, se eligen al azar. 

a) Analizar los datos de este experimento. 

b) Encontrar estimaciones puntuales de los componentes de la varianza utilizando el m£todo del an<Uisis de 
varianza, 

12-11. Considere nuevamente los datos del problema 5-13. Suponga que ambos factores son aleatorios. 

a) Analizar los datos de este experimento. 

b) Estimar los componentes de la varianza. 

12-12. Suponga que en el problema 5-11 las posiciones en el homo se seleccionaron aleatoriamente, dando como 
resultado un experimento con un modelo mixto. Analizar de nuevo los datos de este experimento bajo este 
nuevo supuesto. Estimar los componentes apropiados del modelo. 

12-13. Analizar de nuevo el experimento de los sistemas de medicidn del problema 12-9, suponiendo que los opera- 
dores son un factor fijo. Estimar los componentes apropiados del modelo, 

12-14, En el problema 5-6, suponga que s61o hay cuatro m£quinas de interns, pero los operadores se seleccionaron 
aleatoriamente. 

a) £Qu6 tipo de modelo es apropiado? 

b) Efectuar el an£lisis y estimar los componentes del modelo, 

12-15. Mediante la aplicacidn del operador valor esperado, desarrollar los cuadrados medios esperados del modelo 
factorial mixto con dos factores. Usar los supuestos del modelo restringido, Verificar los resultados con los 
cuadrados medios esperados de la tabla 12-11 para constat ar que concuerdan. 

12-16. Considere el diseho factorial de tres factores del ejemplo 12-6. Proponer los estadisticos de prueba apropia- 
dos para todos los efectos principales y las inter acciones, Repetir para el caso en que A y B son fijos y C es 
aleatorio. 

12-17. Considere el experimento del ejemplo 12-7. Analizar los datos para el caso en que^4, ByC son aleatorios. 
12-18. Deducir los cuadrados medios esperados de la tabla 12-14, 

12-19. Considere un experimento factorial de cuatro factores donde el factor^ tiene a niveles, el factor i? tiene b ni- 
veles, el factor C tiene c niveles, el factor D tiene d niveles y hay n rdplicas. Anotar las sumas de cuadrados, los 
grados de libertady los cuadrados medios esperados para los siguientes casos. Suponer el modelo restringido 
para todos los modelos mixtos, Puede usarse un paquete de computadora como Minitab. 

a) A, B, C y D son factores fijos, 

b) A, B, C y D son factores aleatorios. 

c) A es fijo y B, C y D son aleatorios. 

d) Ay B son fijos y C y D son aleatorios, 

e) A, B y C son fijos y D es aleatorio. 

6Existen pruebas exactas para todos los efectos? Si no es asf, proponer estadisticos de prueba para los efectos 
que no puedan probarse directamente. 

12-20. Considere nuevamente los incisos c,dye del problema 12-19, Obtener los cuadrados medios esperados su- 
poniendo un modelo no restringido. Puede usarse un paquete de computadora como Minitab, Comparar los 
resultados obtenidos con los del modelo restringido. 

12-21. En el problema 5-17, suponga que los tres operadores se seleccionaron al azar. Analizar los datos bajo estas 
condiciones y sacar conclusiones, Estimar los componentes de la varianza. 

12-22. Considere el modelo factorial de tres factores 

fz = 1, 2, . , Q 

yak = k + £ ijk jy _ i ^ 

|fc-l, 2, ..., c 

Suponiendo que los tres factores son aleatorios, desarrollar la tabla del an£lisis de varianza, incluyendo los 
cuadrados medios esperados. Proponer los estadisticos de prueba apropiados para todos los efectos. 
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12-23. El modelo factorial de tres factores para una sola r6plica es 

y* =/ M + r ; + / ? , +Yt HMjk +(*PY)vk + e nk 

Si todos los factores son aleatorios, 6puede probarse alguno de los efectos? Si las interacciones de tres facto- 
res y (t P)ij no existen, £es posible probar todos los dem£s efectos? 

12-24, En el problema 5-6, suponga que tanto las m&quinas como los operadores se escogieron al azar. Determinar 
la potencia de la prueba para detectar un efecto de la m&quina tal que o 2 fi = o 2 ? donde o\ es el componente de 
la varianza del factor maquina. ISon suficientes dos r6plicas? 

12-25. En el analisis de varianza del modelo mixto de dos factores, demostrar que Cov[(t/?)^, (rfi) n ] = -{Ha) para 
i ^ V. 

12-26. Demostrar que el m£todo del analisis de varianza siempre produce estimaciones puntuales insesgadas de los 
componentes de la varianza en cualquier modelo aleatorio o mixto. 

12-27, Invocando los supuestos de normalidad usuales, encontrar una expresidn para la probabilidad de obtener 
una estimation negativa de un componente de la varianza por el m6todo del andlisis de varianza. Utilizando 
este resultado, escribir un enunciado para la probabilidad de que d; < 0 en un an&lisis de varianza de un fac- 
tor. Comentar la utilidad de este enunciado de probabilidad. 

12-28. Analizar los datos del problema 12-9, suponiendo que los operadores son fijos y utilizando tanto la forma no 
restringida como la restringida de los modelos mixtos, Comparar los resultados que se obtienen con los dos 
modelos. 

12-29. Considere el modelo mixto de dos factores, Demostrar que el error estdndar de la media del factor fijo (por 
ejemplo, A) es [MS AB /bn] y2 . 

12-30. Considere los componentes de la varianza del modelo aleatorio del problema 12-9. 

a) Encontrar un intervalo de confianza exacto del 95% para a 2 . 

b) Encontrar intervalos de confianza aproximados del 95 % para los otros componentes de la varianza utili- 
zando el m£todo de Satterthwaite. 

12-31, Usar el experimento descrito en el problema 5-6 y suponer que ambos factores son aleatorios, Encontrar un 
intervalo de confianza exacto del 95% para a 1 . Construir intervalos de confianza aproximados del 95% para 
los otros componentes de la varianza utilizando el m£todo de Satterthwaite. 

12-32. Considere el experimento de tres factores del problema 5-17 y suponga que los operadores se seleccionaron 
al azar. Encontrar un intervalo de confianza aproximado del 95% para el componente de la varianza del ope- 
rador. 

12-33. Resolver de nuevo el problema 12-30 utilizando el m£todo de grandes muestras modificado que se describe 
en la seccidn 12-7,2. Comparar las dos series de intervalos de confianza obtenidas y comentarlas. 

12-34. Resolver de nuevo el problema 12-32 utilizando el metodo de grandes muestras modificado que se describe 
en la seccidn 12-7.2. Comparar este intervalo de confianza con el que se obtuvo anteriormente y comentarlo. 




Disenos anidados 
y de parcelas 
subdivididas 


En este capftulo se introducen dos importantes tipos de disenos experimentales: el diseno anidado y el di- 
seno de parcelas subdivididas. Estos dos disenos encuentran una aplicacion razonablemente generaliza- 
da en el uso industrial de los experimentos disenados. Con frecuencia incluyen tambi6n uno o mas 
factores aleatorios, por lo que algunos de los conceptos introducidos en el capitulo 12 tendran cabida 
aqui. 


13*1 DISENO ANIDADO DE DOS ETAPAS 

En algunos experimentos con factores multiples, los niveles de uno de los factores (por ejemplo el factor 
B) son similares pero no identicos a los diferentes niveles de otro factor (por ejemplo A), A un arreglo 
como este se le llama diseno anidado ojerarquico, con los niveles del factor B anidados bajo los niveles 
del factor A. Por ejemplo, considere una compania que compra su materia prima a tres proveedores dife- 
rentes. La compania quiere determinar si la pureza de la materia prima de cada proveedor es la misma. 
Hay cuatro lotes de materia prima disponibles de cada proveedor, y se haran tres determinaciones de la 
pureza en cada lote. La situacidn se describe en la figura 13-1. 

Se trata de un diseno anidado de dos etapas, con los lotes anidados bajo los proveedores. A primera 
vista se podria preguntar por qu6 no es un experimento factorial. Si fuera un experimento factorial, en- 
tonces el lote 1 se referiria siempre al mismo lote, el lote 2 se referiria siempre al mismo lote, etcftera. 
Evidentemente, no es 6ste el caso, ya que los lotes de cada proveedor son unicos para ese proveedor 
particular. Es decir, el lote 1 del proveedor 1 no tiene relacion con el lote 1 de cualquier otro proveedor, 
el lote 2 del proveedor 1 no tiene relacidn con el lote 2 de cualquier otro proveedor, etcetera. Para sub- 
rayar el hecho de que los lotes de cada proveedor son diferentes, se pueden numerar como 1, 2, 3 y 4 
para el proveedor 1; 5, 6, 7y 8 para el proveedor 2; y 9, 10, 11 y 12 para el proveedor 3, como se muestra en 
la figura 13-2. 

En ocasiones quiza no se sepa si un factor esta cruzado en un arreglo factorial o anidado. Si los niveles 
del factor pueden numerarse arbitrariamente como en la figura 13-2, entonces el factor esta anidado. 
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Lotes 






C >m > 121 ^i3i y 141 

Observaciones < y m y 122 y^ 2 y 142 

L >113 >123 >133 >143 

Figura 13-1 Diseno anidado de dos etapas. 
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1 3*- 1 . 1 Analisis estadis tico 


El modelo estadfstico lineal para el diseno anidado de dos etapas es 


y 9k j u+t.+ fi m + s (ij)k 


i = 1 , 2 ,..., a 
j = l, 2,..., b 
k = l, 2,..., n 


(13-1) 


Es decir, hay a niveles del factor .4, b niveles del factor B anidados bajo cada nivel d&A,yn replicas. El 
submdice j(i) indica que el nivel y'-bsimo del factor B estb anidado bajo el nivel i-bsimo del factor^ . Resul- 
ta conveniente considerar que las rbplicas estan anidadas dentro de la combinacion de los niveles de^4 y 
B; por lo tanto, se usa el subindice (ij)k para el tbrmino del error. Se trata de un diseno anidado balancea- 
do, ya que hay el mismo numero de niveles de B con cada nivel de^4 y el mismo numero de replicas. Puesto 
que no todos los niveles del factors aparecen dentro de todos los niveles del factor^, no puede haber in- 
teraccibn entre Ay B. 

La suma de cuadrados total corregida puede escribirse como 

ttt (y,ik-y...) 2 = ttt [(?,. - 3L )+(h ~ K )+0v - y>, )] 2 (13-2) 

1=1 j=l k= 1 i-1 ;=1 i=l 


Al desarrollar el miembro derecho de la ecuacion 13-2, se obtiene 

SSS Ov - y... f - Oi.. - y... ) 2+ «S2 O v - y,. ) 2+ 22E Ov-y*) 2 (13-3) 

*= 1 /-I *=1 *—l 1= 1 j= 1 i=l j=l k= 1 


ya que los tres t6rminos con productos cruzados son cero. La ecuacidn 13-3 indica que puede hacerse la 
particidn de la suma de cuadrados total en una suma de cuadrados debida al factor^, una suma de cua- 
drados debida al factor B bajo los niveles deA, y una suma de cuadrados debida al error. Simbolicamente, 
la ecuacidn 13-3 puede escribirse como 

SS T = SS A +SS B(A) +SS E (13-4) 

Hay abn - 1 grados de libertad para SS T , a - 1 grados de libertad para SS A , a(b- 1) grados de libertad para 
SS B(A) y a H n - 1) grados de libertad para el error. Observe que abn - 1 = (a - 1) + a(b - 1) + ab(n - 1). Si 
los errores son NID(0, o 2 ), cada una de las sumas de cuadrados del miembro derecho de la ecuacibn 13-4 



Figura 13-2 Disposicidn altemativa del diseno anidado de dos etapas. 
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labia 13*1 Cuadrados medios esperados en el disefio anidado de dos etapas 


E(MS) 

A fijo 

B fijo 

A fijo 

B aleatorio 

A aleatorio 

B aleatorio 

E(MS a ) 

a- 1 

, , bn T rf 

a 1 + na\ + ** 

p a — 1 

o 2 + no\ + bna] 

E(MS Bi4) ) 

2 1 Pm 

<b- 1) 

a 2 + no 2 f 

a 2 + na 2 0 

E(MS e ) 

a 2 

a 2 

a 2 


puede dividirse por sus grados de libertad para obtener cuadrados medios con una distribution indepen- 
diente tales que el cociente de dos cuadrados medios cualesquiera se distribuye como F> 

Los estadisticos apropiados para probar los efectos de los factores^4 y B dependen de si A y B son fijos 
o aleatorios. Si los factoresylyi? son fijos, sesupone que 2“^ r, = Oy2* =1 /? ;(0 = 0(i = 1,2, ...,a).Esdecir, 
la suma de los efectos del tratamiento^4 es cero, y la suma de los efectos del tratamiento B es cero dentro 
de cada nivel deA. De manera altemativa, si A y B son aleatorios, se supone que t, es NID(0, o ] ) y que 
es NID(0, a 2 ), Thmbi6n es frecuente encontrar modelos mixtos con A fijo y B aleatorio. Los cuadrados 
medios esperados pueden determinarse aplicando directamente las reglas del capftulo 12. Para el modelo 
mixto, estos cuadrados medios esperados suponen la forma restringida del modelo del capitulo 12. En la 
tabla 13-1 se muestran los cuadrados medios esperados para estas situaciones. 

La tabla 13-1 indica que si los niveles de^4 y B son fijos,iJ 0 :r i - 0 se prueba con MSJMS E y = 0 
se prueba con MS B(A) /MS E . Si A es un factor fijo y B es aleatorio, entonces // 0 :r, = 0 se prueba con 
MS a /MS B( a) y H 0 :a 2 = 0 se prueba con MS B(A) /MS E , Por ultimo, si tanto^4 como B son factores aleatorios, 
H 0 :al = 0 se prueba con MS A /MS B{A) y H o :o 2 0 = 0 con MS B{A) /MS E , El procedimiento de prueba se resume 
en la tabla del an&lisis de varianza, como se muestra en la tabla 13-2. Las fdrmulas para calcular las sumas 
de cuadrados se obtienen desarrollando las cantidades de la ecuacidn 13-3 y simplificando. Estas son 



(13-5) 


(13-6) 

a b n h a b 

ss *=222 4 

i-i y-i k=i n i=i j-y 

(13-7) 

a b n 2 

j 4- s ; 

i=1 j—l 1 UUn 

(13-8) 


Tabla 13-2 Tabla del andlisis de varlama para el disefio anidado de dos etapas 

Fuente de Suma de Grados de Cuadrado 

variacidn cuadrados libertad medio 


A 

B dentro de^4 
Error 


bn Z Ov. -y.y 

a - 1 

ms a 

(h. -y.y 

«(*- 1) 


EEH (y# ~h.f 

ab(n - 1) 

ms e 

222 ov 

abn - 1 



Tbtal 
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Se observa que la ecuacion 13-6 para .S\S' /M ) puede escribirse como 


SS 


B(A) 


a 

=2 


1 b \i 2 

-Y y 1 - -- 


j = i 


2 

i.. 

bn 


Esto expresa la idea de que es la suma de cuadrados entre los niveles de B para cada nivel de^4, su- 
mados en todos los niveles de>L 


EJEMPLO 13-1 

Considere una compama que compra materia prima en lotes de tres proveedores diferentes. La pureza de 
esta materia prima varfa considerablemente, lo cual ocasiona problemas en la manufactura del producto 
terminado. Quiere determinarse si la variabilidad de la pureza es atribuible a las diferencias entre los pro- 
veedores, Se seleccionan al azar cuatro lotes de materia prima de cada proveedor, y se hacen tres determi- 
naciones de la pureza en cada lote. Se trata, desde luego, de un diseno anidado de dos etapas. Los datos, 
despues de codificarlos restando 93, se muestran en la tabla 13-3. Las sumas de cuadrados se calculan de 
la siguiente manera: 

ii b n t ,2 

= y ^~~abn 

;=1 k = 1 UUn 

= 153.00-^- = 148.31 
36 

..2 


ss '-h 


abn 

— [(-5) 2 +(4) 2 +(14) 2 ]-®- 


SS 


B(A) 


(4)(3) 

= 19.75-4.69=15.06 . 

i a b 1 a 


1. 


;=i /=i 


1=1 

= |[(0) 2 +(-9) 2 +(-l) 2 + - +(2) 2 +(6) z ]- 19.75 
= 89.67-19.75=69.92 


a b n a a o 

ss e = 'Z'Z'2 y l 

i=i j = i i n i-i j=i, 

= 153.00-89,67= 63.33 


Tabla 13-3 Datos codificados de la pureza del ejemplo 134 (Codificacidn: y ijk — pureza - 93) 



Lotes 


Proveedor 1 



Proveedor 2 



Proveedor 3 


1 

2 

3 

4 

1 

2 

3 

4 

1 

2 3 

4 



1 

-2 

-2 

1 

1 

0 

-1 

0 

2 

-2 1 

3 



-1 

-3 

0 

4 

-2 

4 

0 

3 

4 

0 -1 

2 



0 

-4 

i 

0 

-3 

2 

-2 

2 

0 

2 2 

1 

Totales de los lotes 

y>i. 

0 

-9 

-1 

5 

-4 

6 

-3 

5 

6 

0 2 

6 

Totales de los proveedores 

y*.. 



-5 



4 




14 
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Tabla 13-4 Analisis de varianza de los datos del ejemplo 13-1 


Fuente de 
variacidn 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

Cuadrado medio 
esperado 

F o 

Valor P 

Proveedores 

15.06 

2 

7.53 

a 1 + 3o^ + 6^ t\ 

0.97 

0.42 

Lotes (dentro de los proveedores) 

69.92 

9 

7.77 

<7 2 + 3<7^ 

2.94 

0.02 

Error 

63.33 

24 

2.64 

a 2 



Total 

148.31 

35 






En la tabla 13-4 se resume el an&lisis de varianza. Los proveedores son fijos y los lotes aleatorios, por lo 
que los cuadrados medios esperados se obtienen de la columna de en medio de la tabla 13-1 y se repiten 
por conveniencia en la tabla 13-4. Por el examen de los valores P, se concluiria que no hay ningdn efecto 
significativo sobre la pureza debido a los proveedores, pero la pureza de los lotes de materia prima del 
mismo proveedor difieren significativamente. 


Las implicaciones practicas de este experimento y del an&lisis son muy importantes. El objetivo del 
experimentador es encontrar la fuente de la variabilidad en la pureza de la materia prima. Si esta es resul- 
tado de las diferencias entre los proveedores, el problema puede resolverse seleccionando al “mejor” 
proveedor. Sin embargo, esa solution no es aplicable aqui porque la principal fuente de variabilidad es la 
variation de la pureza de un lote a otro dentro de los proveedores. Por lo tanto, el problema debe atacarse 
trabajando con los proveedores para reducir su variabilidad de un lote a otro. Esto puede implicar modifi- 
caciones en los procesos de production de los proveedores o en su sistema interno de control de calidad. 

Observe lo que habria pasado si se hubiera hecho un analisis incorrecto de este diseho como un expe- 
rimento factorial de dos factores. Si se considera que los lotes est&n cruzados con los proveedores, se ob- 
tienen los totales de los lotes de 2, -3, -2 y 16, donde cada celda lote x proveedores contiene tres replicas. 
Por lo tanto, puede calcularse una suma de cuadrados debida a los lotes y una suma de cuadrados de in- 
teractidn. El an&lisis de varianza factorial complete se muestra en la tabla 13-5, suponiendo un modelo mixto. 

Este analisis indica que los lotes difieren significativamente y que hay una interacci6n significativa 
entre los lotes y los proveedores. Sin embargo, es diffcil ofrecer una interpretation pr&ctica de la interac- 
ci6n lotes x proveedores. Por ejemplo, 6esta interaction significativa quiere decir que el efecto del pro- 
veedor no es constante de un lote a otro? Adem&s, la interaction significativa aunada al efecto no 
significativo del proveedor podria llevar al analista a concluir que los proveedores en realidad difieren, 
pero su efecto estO enmascarado por la interaction significativa. 


Tabla 13-5 AnSlisis de varianza incorrecto del disefio anidado de dos etapas del ejemplo 13-1 como un disefio factorial 


(proveedores fijos, 

lotes aleatorios) 





Fuente de 
variacidn 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

F o 

Valor P 

Proveedores (5) 

15.06 

2 

7.53 

1.02 

0.42 

Lotes (. B ) 

25.64 

3 

8.55 

3.24 

0.04 

Interaction S x B 

44.28 

6 

7.38 

2.80 

0.03 

Error 

63.33 

24 

2.64 



Total 

148.31 

35 
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C&lculos 

Algunos paquetes de software de estadistica realizar&n el anftlisis de un diseno anidado. En la tabla 13-6 
se presenta la salida del procedimiento Balanced ANOVA (an£lisis de varianza balanceado) de Minitab 
(utilizando el modelo restringido). Los resultados num6ricos concuerdan con los c£lculos manuales re- 
portados en la tabla 13-4. Minitab tambi6n reporta los cuadrados medios esperados en la parte inferior de 
la tabla 13-6. Recuerde que el simbolo Q[ 1] es un t£rmino cuadratico que representa el efecto fijo de los 
proveedores, por lo que en la notation que se usa aqui, 

a 

2 *? 

Por lo tanto, el t6rmino del efecto fijo en el cuadrado medio esperado de Minitab para los proveedores 
12Q[1] = 122 ? =1 r? / (3- 1) = 62 f = , rf , resultado que concuerda con el que se presenta en el algoritmo ta- 
bular de la tabla 13-4. 

En ocasiones no se cuenta con un programa de computadora especializado para analizar disenos ani- 
dados. Sin embargo, observe, al comparar las tablas 13-4 y 13-5, que 

SS B +SS SXB = 25.64 + 44.28 = 69.92= SS B(S) 

Es decir, la suma de cuadrados de los lotes dentro de los proveedores se compone de la suma de cuadra- 
dos de los lotes m&s la suma de cuadrados de la interaccidn lotes x proveedores. Los grados de libertad 
poseen una propiedad similar; es decir, 

Lotes _ Lotes x Proveedores _ Lotes dentro de los proveedores 
3 +_ 6 “ 9 

Por lo tanto, un programa de computadora para analizar disenos factoriales podria usarse tambi6n para 
analizar disenos anidados agrupando el “efecto principal” del factor anidado y las interacciones de ese 
factor con el factor bajo el que estci anidado. 


Tab la 13-6 Salida de Minitab (Balanced ANOVA) [anSlisis de varianza balanceado) para el ejemplo 13-1 
An&lisis de varianza (disenos balanceados) 

Factor Type Levels Values 

Supplier fixed 3123 

Batch(Supplier) random 41234 


Analysis of Variance for Purity 


Source 

DF 

SS 

MS F P 

Supplier 

2 

15.056 

7.528 0.97 0.416 

Batch(Supplier) 

9 

69.917 

7.769 2.94 0.017 

Error 

24 

63.333 

2.639 

Total 

35 

148.306 


Source 

Variance Error 

Expected Mean Square for Each Term 


component term 

(using restricted model) 

1 Supplier 


2 

(3) + 3(2) + i2aci: 

2 BatchCSupplier 

) 

1.710 3 

(3) + 3(2) 

3 Error 


2.639 

(3) 
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13-1.2 Verificaci6n del diagn6stico 

La herramienta principal para vcrificar el diagn6stico es el analisis residual. Para el diseno anidado de 
dos etapas, los residuales son 


El valor ajustado es 


e ijk y ijk y ijk 

y iik =fi+?i+Pw) 


y si se establecen las restricciones usuales sobre los parametros del modelo (2. , i. = 0 v 2 . /3 , (1) = 0. i = 1, 
2, a), entonces fi - y , t, = y L - y , y yS ;(i) = y tj - y L . Por consiguiente, el valor ajustado es 

%jk - y... +(>,.. - y ... )+(?«. - y L ) 


Por lo tanto, los residuales del diseno anidado de dos etapas son 

e nk = y,j k ~ h ( 13 - 9 ) 

donde y tj son los promedios de los lotes individuates. 

Las observaciones, los valores ajustados y los residuales para los datos de la pureza del ejemplo 
13-1 son: 


Valor observation 

Valor ajustado $ ijk =y ij 

e tjk -y^k 

1 

0.00 

1.00 

-1 

0.00 

-1.00 

0 

0.00 

0.00 

-2 

-3.00 

1.00 

-3 

-3.00 

0.00 

-4 

-3.00 

-1.00 

-2 

-0.33 

-1.67 

0 

-0.33 

0.33 

1 

-0.33 

1.33 

1 

1.67 

-0.67 

4 

1.67 

2.33 

0 

1.67 

-1.67 

1 

-1.33 

2,33 

-2 

-1.33 

-0.67 

-3 

-1.33 

-1.67 

0 

2.00 

-2.00 

4 

2.00 

2.00 

2 

2.00 

0.00 

-1 

-1.00 

0,00 

0 

-1.00 

1.00 

-2 

-1.00 

-1.00 

0 

1,67 

-1.67 

3 

1.67 

1.33 

2 

1.67 

0.33 

2 

2.00 

0.00 
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Valor observadoy 0 * 

Valor ajustado 9 ijk = y u 

e m =y„ k -y„. 

4 

ZOO 

2.00 

0 

ZOO 

-2.00 

-2 

0.00 

-2 00 

0 

0.00 

0.00 

2 

0.00 

ZOO 

1 

0.67 

0.33 

-1 

0.67 

-1.67 

2 

0.67 

1.33 

3 

2.00 

1.00 

2 

2.00 

0.00 

1 

ZOO 

-1.00 


Pueden realizarse ahora las verificaciones de diagndstico usuales; incluyendo las graficas de probabilidad 
normal, la verification de puntos atipicos y la graficacidn de los residuales contra los valores ajustados. 
Como una ilustracidn, en la figura 13-3 se grafican los residuales contra los valores ajustados y contra los 
niveles del factor proveedor. 



- 3 - 2-10 1 2 
Valores predichos 


o) GrSfica de los residuales contra los valores predichos 



1 2 3 


Proveedor 


b) GrSfica de los residuales contra el proveedor 
Figura 13-3 Gr&ficas de los residuales del ejemplo 13-1. 
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En la situaci6n de un problema como el que se describe en el ejemplo 13-1, las gr&ficas de los residua- 
les son particularmente dtiles debido a la information de diagnostico adicional que contienen. Por ejem- 
plo, el analisis de varianza ha indicado que la pureza media de los tres proveedores no difiere pero que 
hay una variabilidad estadisticamente significativa de un lote a otro (es decir, a >0). Pero, £la variabili- 
dad dentro de los lotes es la misma para todos los proveedores? Se ha supuesto de hecho que 6ste es el 
caso, y si no es cierto desde luego que nos gustaria saberlo, ya que tiene un impacto pr&ctico considerable 
sobre la interpretation de los resultados del experimento. La gr&fica de los residuales contra los provee- 
dores de la figura 13-36 es una manera simple pero eficaz de verificar este supuesto. Puesto que la disper- 
sion de los residuales es aproximadamente la misma para los tres proveedores, se concluiria que la 
variabilidad en la pureza de un lote a otro es aproximadamente la misma para los tres proveedores. 


1 3 * 1 ,3 Componentes de la varianza 


Para el caso de efectos aleatorios, el mOtodo del analisis de varianza puede usarse para estimar los com- 
ponentes de la varianza a 2 , o 2 y a 2 . Por los cuadrados medios esperados de la ultima columna de la tabla 
13-1, se obtiene 


a 2 = MS e 
2 _ ~ MS e 


(13-10) 

(13-11) 


y 


ms a -ms B{A) 

bn 


(13-12) 


En muchas aplicaciones de disenos anidados interviene un modelo mixto, con el efecto principal (A) 
fijo y el factor anidado ( B ) aleatorio, Este es el caso para el problema descrito en el ejemplo 13-1; los pro- 
veedores (factor^) son fijos, y los lotes de materia prima (factor B) son aleatorios. Los efectos de los pro- 
veedores pueden estimarse con 

. -5 13 -28 

T i ” y “ 12 36 “ 36 

. _ _ 4 13 — 1 

T 2 yi - y 12 36 36 
A = _ __ = 14_13 = 29 
Tl ~ y3 y - ~ 12 36 ~ 36 

Para estimar los componentes de la varianza a 2 y a * , se elimina la linea de la tabla del an&lisis de varianza 
relativo a los proveedores y se aplica el m6todo de estimation del an&lisis de varianza a las dos lineas si- 
guientes. Se obtiene asi 

d 2 = MS e = 2.64 


y 



MS B(A) ms g 


7.77- 164 


1.71 


n 


3 


566 CAPiTTJLO 13 DISENOS ANIDADOS YDE PARCELS SUBDIVIDIDAS 


Etapa 1 


Eta pa 2 


Etapa 3 


Lote 1 ... 



Figure 13-4 Diseno anidado escalonado de dos etapas. 


Estos resultados se muestran tambien en la parte inferior de la salida de Minitab de la tabla 13-6. Por el 
an&lisis del ejemplo 13-1, se sabe que r t no difiere significativamente de cero, mientras que el compon^nte 
de la varianza o* es mayor que cero. 


13^1.4 Diserios anidados por etapas 

Un problema potencial en la aplicacion de los disenos anidados es que en ocasiones para obtener un nu- 
mero razonable de grados de libertad en el nivel m£$ alto, puede terminarse con muchos grados de liber- 
tad (quiza demasiados) en las etapas inferiores. Para ilustrar, suponga que se est&n investigando las 
diferencias potenciales en el an&lisis quimico entre diferentes lotes de material Se planea tomar cinco 
muestras por lote, y cada muestra se medir& dos veces, Si quiere estimarse un componente de la varianza 
para los lotes, entonces 10 lotes no seria una eleccibn irrazonable. Esto resulta en 9 grados de libertad 
para los lotes, 40 grados de libertad para las muestras y 50 grados de libertad para las mediciones, 
Una manera de evitar esta situacibn es usar un tipo particular de diseno anidado no balanceado 11a- 
mado diseno anidado por etapas. En la figura 13-4 se muestra un ejemplo de un diseno anidado escalona- 
do. Observe que solo se toman dos muestras de cada lote; una de ellas se mide dos veces, mientras que la 
otra una sola vez. Si hay a lotes, entonces habrft a - 1 grados de libertad para los lotes (o, en general, la eta- 
pa superior), y todas las etapas inferiores tendr&n exactamente a grados de libertad, Para m&s informa- 
cibn sobre el uso y el analisis de estos disenos, ver Bainbridge [5], Smith y Beverly [104] y Nelson [88a, b, 
c], asi como el material suplementario del texto de este capitulo. 


13*2 DISENO ANIDADO GENERAL DE m ETAPAS 

Los resultados de la seccibn 13-1 pueden extenderse Mcilmente al caso de m factores completamente ani- 
dados. A este diseno se le llamaria diseno anidado dem etapas. Como un ejemplo, suponga que una fun- 
dicibn quiere investigar la dureza de dos formulaciones diferentes de una aleacibn de metal. Se preparan 
tres hornadas de cada formulacibn de la aleacibn, se seleccionan dos lingotes al azar de cada hornada 
para probarlos, y se hacen dos mediciones de la dureza en cada lingote. La situacibn se ilustra en la figura 
13-5. 

En este experimento, las hornadas est&n anidadas bajo los niveles del factor formulacibn de la alea- 
cibn, y los lingotes estan anidados bajo los niveles del factor hornada. Por lo tanto, se trata de un diseno 
anidado de tres etapas con dos rbplicas. 
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Formulacldn 
de la aleacldn 


Hornadas 

llngotes 

Observed ones 



>1112 >1122 > 1212 >1222 *1312 >1322 


Figura 13-5 Diseno anidado de tres etapas. 



>2111 

>2121 

>2211 

>2221 

>2311 

>2321 

>2112 

>2122 

>2212 

>2222 

>2312 

>2322 


El modelo para el diseno anidado general de tres etapas es 


y m =f l+t i + Pm + y*<») +e mi 


i = 1, 2, a 

j = l, % b 

k = 1,2, .... c 
1 = 1,2, n 


(13-13) 


Para el ejemplo tratado aqui, r ; es el efecto de la formulacidn de la aleacion j-6sima, fi m es el efecto de la 
hornada /-6sima dentro de la aleaci6n i-esima, y kVf) es el efecto del lingote /c-esimo dentro de la hornada 



Figura 13-6 Fuentes de variacidn en el ejemplo del diseno anidado de 
tres etapas. 
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Tabla 13^7 An&lisis de varianza del diseno anidado de tres etapas 


Fuente de 
variacidn 

Suma de cuadrados 

Grados de Cuadrado 
libertad medio 

A 

bcn^ (y L -y J 

i 

a- 1 

ms a 

B (dentro deyl) 

i J 

a(b-l) 

ms B(A) 

C (dentro de#) 

‘ j * 

ab(c - 1 ) 


Error 

EEEE (.y^-yuk.f 

i j k i 

abc(n - 1 ) 

ms e 

Total 

i j k i 

abcn - 1 



/-esima y la aleacion i-6sima, y E (ijk) i es el t^rmino del error NID(0, cr 2 ) usual. La extension de este modelo a 
m factores es directa. 

Observe que en el ejemplo anterior la variabilidad global de la dureza constb de tres componentes: 
uno que resulto de las formulaciones de las aleaciones, otro que se genero de las hornadas y uno mas que 
salio del error de la prueba analitica. Estos componentes de la variabilidad en la dureza global se ilustran 
en la figura 13-6. 

Este ejemplo demuestra la manera en que se usa frecuentemente el diseno anidado en el analisis de 
procesos para identificar las principales fuentes de variabilidad en la salida. Por ejemplo, si el componen- 
te de la varianza de la formulacion de la aleacion es grande, entonces esto implica que la variabilidad glo- 
bal de la dureza podria reducirse utilizando unicamente una de las formulaciones de la aleacion. 

El calculo de las sumas de cuadrados y el analisis de varianza del diseno anidado de m etapas son si- 
milares al analisis presentado en la section 13-1. Por ejemplo, el analisis de varianza del diseno anidado 
de tres etapas se resume en la tabla 13-7. En esta tabla se muestran tambi6n las definiciones de las sumas 
de cuadrados. Observe que son una extensi6n simple de las formulas para el diseno anidado de dos eta- 
pas. Muchos paquetes de software de estadistica realizaran los c&lculos. 

Para determinar los estadfsticos de prueba apropiados deben encontrarse los cuadrados medios es- 
perados empleando los metodos del capitulo 12. Por ejemplo, si los factores^ y B son fijos y el factor C es 
aleatorio, entonces los cuadrados medios esperados pueden derivarse como se indica en la tabla 13-8. En 
esta tabla se indican los estadfsticos de prueba apropiados para esta situation. 


Tabla 13-8 Derivaci6n de los cuadrados medios esperados para un diseno anidado 
de tres etapas con Ay B fijos y C aleatorio 


Factor 

F 

a 

i 

F 

b 

j 

R 

c 

k 

R 

n 

l 

Cuadrado medio esperado 

L 

0 

b 

c 

n 

bcjiS" t] 

<r + W7; + ^ — 

7 a - 1 


1 

0 

c 

n 

j2 | j2 . P%) 

a+na ' + a(b- 1) 

y k(ij) 

1 

1 

1 

n 

a 1 + no 2 

E >m 

1 

1 

1 

1 

o 1 
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13-3 DISENOS CON FACTORES ANIDADOS Y FACTORIALES 


En experimentos con factores multiples, algunos factores pueden estar incluidos en un arreglo factorial y 
otros estar anidados. En ocasiones a estos disenos se les llama disenos factoriales-anidados. El an&lisis 
estadfstico de un diseno asf con tres factores se ilustra en el ejemplo siguiente. 


EJEMPLO 13-2 

Un ingeniero industrial estudia la insertion manual de componentes electronicos en taijetas de circuitos 
impresos a fin de mejorar la rapidez de la operation de ensamblaje. Ha disenado tres dispositivos de en- 
samblajey dos arreglos del sitio de trabajo que parecen prometedores. Se necesitan operadores para rea- 
lizar el ensamblaje, y se decide seleccionar aleatoriamente cuatro operadores para cada combinacidn 
dispositivo-arreglo del sitio de trabajo. Sin embargo, debido a que los sitios de trabajo se encuentran en 
diferentes puntos dentro de la planta, es dificil usar los mismos cuatro operadores para cada arreglo del 
sitio de trabajo. Por lo tanto, los cuatro operadores escogidos para el arreglo 1 son diferentes de los cuatro 
para el arreglo 2. Puesto que solo hay tres dispositivos y dos arreglos del sitio de trabajo, y los operadores 
se escogen al azar, se trata de un modelo mixto. Las combinaciones de tratamientos de este diseno se co- 
rren en orden aleatorio y se obtienen dos replicas. Los tiempos de ensamblaje se miden en segundos y se 
muestran en la tabla 13-9. 

En este experimento, los operadores est&n anidados dentro de los niveles de los arreglos del sitio de 
trabajo, mientras que los dispositivos y los arreglos del sitio de trabajo estan incluidos en un factorial. Por 
lo tanto, este diseno tiene factores anidados y factoriales. El modelo lineal para este diseno es 


JW = +Pj +Yk U ) +(*y)*cn +«(*)/ 


i = 1, 2, 3 

7 = 1, 2 

k = 1, 2, 3, 4 

1 = 1 , 2 


(13-14) 


donde r, es el efecto del dispositivo i-esimo, fi, es el efecto del arreglo del sitio de trabajo ;'-6simo, y k(J) es el 
efecto del operador A>esimo dentro del nivel /-esimo del arreglo del sitio de trabajo, (r/3),j es la interaccion 
dispositivo x arreglo del sitio de trabajo, (ry)^ es la interaccion dispositivo x operadores dentro del 
arreglo del sitio de trabajo, y s im es el termino del error usual. Observe que no puede existir ninguna in- 
teraction arreglo del sitio de trabajo x operador porque no todos los operadores usan lodos los arreglos 
del sitio de trabajo. Asimismo, tampoco puede haber ninguna interaccion dispositivo x arreglo del sitio 
de trabajo x operador. En la tabla 13-10 se derivan los cuadrados medios esperados utilizando el algo- 
ritmo tabular del capftulo 12. Esto produce el analisis de un modelo mixto restringido. El estadfstico de 
prueba apropiado para cualquier efecto o interaccion puede encontrarse inspeccionando esta tabla. 


labia 13-9 Datos del tiempo de ensamblaje del ejemplo 13-2 


Operador 


Arreglo 1 



Arreglo 2 


yt. 

1 

2 

3 

4 

1 

2 

3 

4 

Dispositivos 1 

22 

23 

28 

25 

26 

27 

28 

24 

404 

24 

24 

29 

23 

28 

25 

25 

23 


Dispositivos 2 

30 

29 

30 

27 

29 

30 

24 

28 

447 


27 

28 

32 

25 

28 

27 

23 

30 


Dispositivos 3 

25 

24 

27 

26 

27 

26 

24 

28 

401 


21 

22 

25 

23 

25 

24 

27 

27 


Totales de los operadores, y_ ]k 149 

Tbtales de los arreglos, y, 

150 171 

619 

149 

163 

159 151 

633 

160 

1252 = y„. 
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Tabla 13-10 Derivaci6n del cuadrado medio esperado del ejemplo 13-2 



F 

F 

R 

R 



3 

2 

4 

2 


Factor 

i 

] 

k 

i 

Cuadrado medio esperado 

r i 

0 

2 

4 

2 . 

o 2 + 2a 1 ri ,+ S^ r? 

p, 

3 

0 

4 

2 

o- 2 + fyy 2 + 24^ ft) 

YkO) ■ 

3 

1 

1 

2 

c r 2 +6cr 2 

m< 

0 

0 

4 

2 


(ry) ii(n 

0 

1 

.1 

2 

a 2 + 2< 

fliM 

1 

1 

1 

1 

a 1 


En la tabla 13-11 se muestra el analisis de varianza completo. Se observa que los dispositivos de en- 
samblaje son significativos y que los operadores dentro de los arreglos del sitio de trabajo tambien difie- 
ren significativamente. Estd presente tambien una interaccion significativa entre los dispositivos y los 
operadores dentro de los arreglos del sitio de trabajo, indicando que los efectos de los diferentes disposi- 
tivos no son los mismos para todos los operadores. Los arreglos del sitio de trabajo parecen tener un efec- 
to reducido sobre el tiempo de ensamblaje. Por lo tanto, para minimizar el tiempo de ensamblaje, la 
atencion deberia centrarse en los dispositivos tipo 1 y 3. (Observe que los totales de los dispositivos de la 
tabla 13-9 son menores para los tipos 1 y 3 que para el tipo 2. Esta diferencia en las medias del tipo de dis- 
positivo podria probarse formalmente utilizando comparaciones multiples.) Adem&s, la interaccidn entre 
los operadores y los dispositivos implica que algunos operadores son m£s eficientes que otros al utilizar 
los mismos dispositivos. Quizas estos efectos operador-dispositivo podrian aislarse y los operadores cuyo 
desempeno es menos eficiente podrian mejorar impartiendoles capacitacion adicional. 


Calculos 

Hay varios paquetes de software de estadistica que analizan con facilidad disenos factoriales-anidados, 
incluyendo Minitab y SAS. En la tabla 13-12 se presenta la salida de Minitab (Balanced ANOVA, analisis 
de varianza balanceado), suponiendo la forma restringida del modelo mixto, para el ejemplo 13-2. Los 
cuadrados medios esperados de la parte inferior de la tabla 13-12 concuerdan con los que se derivaron 
con el metodo tabular de la tabla 13-10. Q[ 1], Q[3] y <2[4] son los efectos del factor fijo para los arreglos 
del sitio de trabajo, los dispositivos, y la interaccion arreglo del sitio de trabajo x dispositivo, respectiva- 
mente. Las estimaciones de los componentes de la varianza son: 

Operador (arreglo): a 2 = 1.609 

Dispositivo x operador (arreglo): o\ ; = 1.576 

Error: a 2 = 2.333 


Tabla 13-11 AnSlisis de varianza del ejemplo 13-2 


Fuente de variacidn 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

*0 

Valor P 

Dispositivos (F) 

82.80 

2 

41.40 

7.54 

0.01 

Arreglos (L) 

4.08 

1 

4.09 

0.34 

0.58 

Operadores (dentro de los arreglos), O (L) 

71.91 

6 

11.99 

5.15 

<0.01 

FL 

19.04 

2 

9.52 

1.73 

0.22 

FO(L) 

65.84 

12 

5.49 

2.36 

0.04 

Error 

56.00 

24 

2.33 



Total 

299.67 

47 






labia 13*12 Andlisis Balanced ANOVA de Minitab del ejemplo 13-2 utilizando el modelo restringido 
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En la tabla 13-13 se presenta el analisis de Minitab del ejemplo 13-2 utilizando la forma no restringida 
del modelo mixto. Los cuadrados medios esperados de la parte inferior de esta tabla son ligeramente di- 
ferentes de los que se reportaron para el modelo restringido y, por lo tanto, la construction de los estadis- 
ticos de prueba sera ligeramente diferente para el factor operadores (arreglo). Especificamente, el 
denominador del cociente F de los operadores (arreglo) es la interaccion dispositivos x operadores 
(arreglo) del modelo restringido (12 grados de libertad para el error), y es la interaccidn arreglo x dispo- 
sitivos en el modelo no restringido (2 grados de libertad para el error). Puesto que M S ^ x dispositivos > 

^^dispostiivos x opcrador (arrcgio)> y tiene menos grados de libertad, se encuentra ahora que el operador dentro del 
efecto del arreglo solo es significativo en el nivel aproximado de 12% (el valor P fue 0.002 en el analisis del 
modelo restringido). Ademas, la estimation del componente de la varianza a] = 1.083 es menor. Sin em- 
bargo, puesto que esta presente un efecto grande de los dispositivos y una interaccion dispositivos x ope- 
rador (arreglo) significativa, seguiria sospechandose que existe un efecto del operador y, por lo tanto, las 
conclusiones practicas de este experimento no son afectadas mucho por elegir la forma restringida o la no 
restringida del modelo mixto. Las cantidades Q[l, 4] y <2[3, 4] son terininos cuadraticos del tipo fijo que 
contienen el efecto de interaccion arreglos x dispositivos. 

Si no se cuenta con un paquete de software especializado como SAS o Minitab, entonces puede usar- 
se un programa para analizar experimentos factoriales con factores anidados y factoriales. Asi, el experi- 
mento del ejemplo 13-2 podria considerarse como un factorial de tres factores, con los dispositivos (F), 
los operadores ( O ) y los arreglos (L) como los factores. Entonces se agruparian ciertas sumas de cuadra- 
dos y ciertos grados de libertad para formar las cantidades apropiadas requeridas para el diseno con los 
factores anidados y factoriales de la siguiente manera: 


An&iisis factorial 


Analisis factorial-anidado 

Suma de cuadrados 

Grados de 


Grados de 

libertad 

Suma de cuadrados 

libertad 

SS F 

2 

SS F 

2 

SS L 

1 

SS L 

1 

SS FL 

2 

SS F L 

2 

SSo 

3 




3 

S$0(L) = SS 0 + SS LO 

6 

SS F0 

SSfol 

6 

6 

SSpO(L) — SSfO + SSfOL 

12 

SS F 

24 

ss E 

24 

SS T 

47 

SS T 

47 


13'4 DISENO DE PARCELAS SUBDIVIDIDAS 

En algunos experimentos factoriales con factores multiples quiz& no sea posible la aleatorizacion comple- 
ta del orden de las corridas. Esto suele resultar en una generalization del diseno factorial llamada diseno 
de parcelas subdivididas. 

Como un ejemplo, considere un fabricante de papel que esta interesado en tres metodos diferentes 
para preparar la pulpa y cuatro temperaturas de coccidn diferentes de la pulpa y que desea estudiar el 
efecto de estos dos factores sobre la resistencia a la tension del papel. Cada replica de un experimento fac- 
torial requiere 12 observaciones, y el experimentador ha decidido correr tres replicas. Sin embargo, la ca- 
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pacidad de la planta piloto s61o pennite realizar 12 corridas por dia, por lo que el experimentador decide 
correr una rdplica en cada uno de tres dias y considerar los dias o las rdplicas como bloques. En un dia lle- 
va a cabo el experimento de la siguiente manera. Se produce un lote de pulpa con uno de los tres mdtodos 
bajo estudio. Despuds este lote se divide en cuatro muestras, y la coccion de cada muestra se hace con una 
de las cuatro temperaturas. Entonces se produce un segundo lote de pulpa utilizando otro de los tres me- 
todos. Este segundo lote tambidn se divide en cuatro muestras que se prueban con las cuatro temperatu- 
ras. Despuds se repite el proceso, utilizando un lote de pulpa producido por el tercer mdtodo. Los datos se 
muestran en la tabla 13-14. 

Tni r.ia1mf.nte, esto podria considerarse un experimento factorial con tres niveles del mdtodo de pre- 
paracidn (factor A) y cuatro niveles de la temperatura (factor B) en un bloque aleatorizado. Si este fuera 
el caso, entonces el orden de experimentacion dentro de cada rdplica o bloque deberia ser completamen- 
te aleatorizado. Es decir, dentro de un bloque deberia seleccionarse aleatoriamente una combinacidn de 
tratamientos (un mdtodo de preparacidn y una temperatura) y obtener una observacidn, despues deberia 
seleccionarse aleatoriamente otra combination de tratamientos y obtener una segunda observacidn, y asi 
sucesivamente hasta que se hayan tornado las 12 observaciones en el bloque. Sin embargo, el experimen- 
tador no recabo los datos de esta manera. El hizo un lote de pulpa y obtuvo observaciones para las cuatro 
temperaturas de ese lote. Debido a la economia para preparar los lotes y al tamano de los lotes, dsta es la 
unica manera factible de correr este experimento. Un experimento factorial completamente aleatorizado 
requeriria 36 lotes de pulpa, lo cual es totalmente irrealista. El diseno de parcelas subdivididas requiere 
sdlo tres lotes de pulpa por bloque (rdplica), en este caso 9 lotes en total. Evidentemente, el diseno de par- 
celas subdivididas ha dado como resultado una eficiencia experimental considerable. 

El diseno utilizado en el ejemplo de la pulpa es de parcelas subdivididas. Cada rdplica o bloque del di- 
seno de parcelas subdivididas se divide en tres partes Uamadas parcelas completas, y a los mdtodos de 
preparacidn se les llama tratamientos principales o de parcelas completas. Cada parcela completa se di- 
vide en cuatro partes Uama das subparcelas (o parcelas subdivididas), y se asigna una temperatura a cada 
una de ellas. A la temperatura se le llama el tratamiento de la subparcela. Observe que si estdn presentes 
otros factores no controlados o fuera del diseno, y si estos factores no controlados varian cuando los md- 
todos para preparar la pulpa se modifican, entonces cualquier efecto de los factores fuera del diseno so- 
bre la respuesta estard completamente confundido (o mezclado) con el efecto de los mdtodos para 
preparar la pulpa. Puesto que los tratamientos de las parcelas completas de un diseno de parcelas subdivi- 
didas est&n confundidos con las parcelas completas y los tratamientos de las subparcelas no estan confun- 
didos, es mejor asignar el factor en el que haya mayor interds a las subparcelas, de ser posible. 

Este ejemplo es bastante tfpico de la forma en que se usan los disenos de parcelas subdivididas en un 
ambiente industrial. Observe que, en esencia, los dos factores “se aplicaron” en tiempos diferentes. Por 
consiguiente, un diseno de parcelas subdivididas puede considerarse como dos experimentos combina- 


TxhU 1 1-1 4 El experimento de la resistencia a la tensi6n del papel 

Mdtodo de preparation 
de la pulpa 

Rdplica (o 
bloque) 1 

Rdplica (o 
bloque) 2 

Rdplica (o 
bloque) 3 

1 

2 

3 

1 

2 

3 

1 

2 

3 

Tfemperatura (°F) 










200 

30 

34 

29 

28 

31 

31 

31 

35 

32 

225 

35 

41 

26 

32 

36 

30 

37 

40 

34 

250 

37 

38 

33 

40 

42 

32 

41 

39 

39 

275 

36 

42 

36 

41 

40 

40 

40 

44 

45 
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dos” o superpuestos entre si. Un “experimento” tiene el factor parcela completa aplicado a las unidades 
experimentales grandes (o es un factor cuyos niveles son dificiles de cambiar) y el otro “experimento” tie- 
ne el factor subparcela aplicado a las unidades experimentales m£$ pequenas (o es un factor cuyos niveles 
son f&ciles de cambiar). 

El modelo lineal para el diseiio de parcelas subdivididas es 


y* = t* +T i + &j +Y k +(*y)* 


+(Py) Jk +E uk 


1 = 1 , 2 , T 
j = l, 2, .... a 
[k = l,2 


(13-15) 


donde r„/?,y (T/8) /y representan la parcela completa y corresponden respectivamente a los bloques (o repli- 
cas), a los tratamientos principales (factor^!) y al error de la parcela completa [replicas (o bloques) x A); 
y (ry)it> (fiy)jk y ( x Pv)ij k representan la subparcela y corresponden respectivamente al tratamiento de la 
subparcela (factor B), las replicas (o bloques) x B y las interacciones AB, y al error de la subparcela (blo- 
ques x AB). Observe que el error de la parcela completa es la interaction replicas (o bloques) x Ay que 
el error de la subparcela es la interaction de tres factores bloques x AB. Las sumas de cuadrados para es- 
tos factores se calculan como en el analisis de varianza de tres factores sin replicas. 

Los cuadrados medios esperados del diseiio de parcelas subdivididas, con las replicas o bloques alea- 
torios y los tratamientos principales y los tratamientos de subparcelas fijas, se derivan en la tabla 13-15. 
Observe que el factor principal (A) de la parcela completa se prueba contra el error de la parcela comple- 
ta, mientras que el subtratamiento (B) se prueba contra la interaction replicas (o bloques) x subtrata- 
mientos. La interactional .6 se prueba contra el error de la subparcela. Observe que no hay pruebas para 
el efecto de la replica (o bloque) (A) o la interaction replica (o bloque) x subtratamiento (AC). 

El an&lisis de varianza de los datos de la resistencia a la tension de la tabla 13-14 se resume en la tabla 
13-16. Puesto que tanto los mOtodos de preparation como las temperatures son fijos y las replicas son 
aleatorias, son aplicables los cuadrados medios esperados de la tabla 13-15. El cuadrado medio de los 
mOtodos de preparation se compare con el cuadrado medio del error de la parcela completa, y el cuadra- 


Tabla 13-15 Derivaci6n del cuadrado medio esperado del disefto de parcelas subdivididas 



Factor 

T 

R 

i 

a 

F 

j 

b 

F 

k 

1 

R 

h 

Cuadrado medio esperado 



1 

a 

b 

1 

a 2 + aba 2 

Parcela completa 

h 

r 

0 

b 

1 

*+*+* 2 * 


m 

1 

0 

b 

1 

o 1 + ba% 


Yk 

r 

a 

0 

1 

, , raV Yt 

a + aa„ + -7=*-— 







(b-1) 


(*y)» 

1 

a 

0 

1 

a 2 + aa 2 v . 

Subparcela 

(PYh 

r 

0 

0 

1 

+ r 22 (Ml 

+ <, “ + («- 1 X 6 - 1 ) 


(*Py)ik 

1 

0 

0 

1 

a l + 0 ^ 


— 

1 

1 

1 

1 

a (no estimable) 
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subtratamiento. Esta situation tambidn es similar a un submuestreo, como lo describe Ostle [92]. Supo- 
niendo que A y B son fijos, los cuadrados medios esperados en este caso son 


E(MS A ) = o 2 9 +nol + 


T J 

fl— 1 


E(MS B )=a 2 e +no\ + 


an ^ P) 
b - 1 


E(MS AB )=al+ncl + 


( r ^)» 

(a-l)(b- 1) 


E(MS e ) = <j 2 9 


(13-18) 


Por lo tanto, no hay pruebas para los efectos principals a menos que la interaccidn sea insignificante. La 
situation es exactamente la de un analisis de varianza de dos factores con una observation por celda. Si 
los dos factores son aleatorios, entonces los efectos principals pueden probarse contra la interaccidnAB. 
Si sdlo uno de los factores es aleatorio, entonces el factor fijo puede probarse contra la interaccionAB. 

En general, si se analiza un diseno factorial y todos los efectos principals y las interacciones son sig- 
nificativos, entonces deberd examinarse con mention como se realizo realmente el experimento. Puede 
haber restricciones sobre la aleatorizacidn en el modelo que no se tomaron en cuenta en el analisis y, por 
consiguiente, los datos no deber&n analizarse como un factorial. 
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13-5.1 Diseno de parcelas subdivididas con mds de dos factores 

En ocasiones se encuentra que la parcela completa o la subparcela contendran dos o mas factores, dis- 
puestos en una estructura factorial. Como un ejemplo, considere un experimento conducido en un homo 
para hacer crecer un 6xido en una oblea de silicio. Las variables de respuesta de interes son el espesor de 
la capa de 6xido y la uniformidad de la capa. Hay cuatro factores del diseno: la temperatura (A), el flujo 
de gas (B), el tiempo (C) y la posicidn de la oblea en el homo (£>). El experimentador planea correr un di- 
seno factorial 2 4 con dos rdplicas (32 ensayos). Ahora bien, los factores A y B (la temperatura y el flujo de 
gas) son diffciles de cambiar, mientras que C y D (el tiempo y la posicidn de la oblea) son f&ciles de modifi- 
car. Esto lleva al disefio de parcelas subdivididas que se muestra en la figura 13-7. Observe que las dos re- 
plicas del experimento est^n subdivididas en cuatro parcelas completas, cada una de las cuales contiene 
una combination de los ajustes de la temperatura y el flujo de gas. Una vez que se eligen estos niveles, 
cada parcela completa se subdivide en cuatro subparcelas, y se realiza un diseno factorial 2 en los facto- 
res tiempo y positidn de la oblea, donde las combinaciones de tratamientos de la subparcela se pmeban 
en orden aleatorio. LInicamente se hacen cuatro cambios de la temperatura y del flujo de gas en cada re- 
plica, mientras que los niveles del tiempo y la position de la oblea estan completamente aleatorizados. 

Un modelo para este experimento, consistente con la ecuacidn 13-16, es 

JW =B +t i +Pj + Yk +(Pv)jk +e ijk +<i / +A m -‘‘Wto. 

+(ps) jt +(pk) Jm +(y< 5 )« HPyfyju + (Py*)m 

i = 1,2 
7 = 1 , 2 
fc*l, 2 
1 = 1 , 2 
m = 1 , 2 


-K/wav +GM*V« +*«**, 


(13-19) 
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Figure 13-7 Diseno de parcelas subdivididas con cuatro factores del diseno, dos en la parcela completa y dos 
en la subparcela, 

donde r, representa el efecto de la r6plica, y y k los efectos principales de la parcela completa, 0 ijk es el 
error de la parcela completa, <5, y A m representan los efectos principales de la subparcela y e ijklm es el error 
de la subparcela. Se han incluido todas las interacciones entre los cuatro factores del diseno. En la tabla 
13-17 se presenta el an&lisis de varianza de este diseno, suponiendo que las rdplicas son aleatorias y que 
todos los factores del diseno son efectos fijos. En esta tabla, a 2 e y a * representan las varianzas de los erro- 
res de la parcela completa y de la subparcela, respectivamente, es la varianza de los efectos de los bio- 


Parcela 

completa 


+ 



Tabla 13-17 Anilisis abreviado de un diseno de parcelas subdivididas con los factores A y 
y los factores C y D en las subparcelas (referirse a la figura 13-7) 

B en las parcelas completas 

Fuente de 
variation 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado medio esperado 

R6plicas (r,) 

^R<plicas 

1 

<7* + 1&7* 


SS A 

1 

o] + 8 (7% + A 

B(y k ) 

ss B 

1 

o] + 8o 2 e + B 

AB 


1 

o 2 E + 8o 2 e + AB 

Error de la parcela completa (9 ijk ) 

SSjyp 

3 

ol+H 

cm 

ss c 

1 

o* + C 

D(K) 

SS D 

1 

o\ + D 

CD 


1 

a i + CD 

AC 

S$AC 

1 

a] + AC 

BC 

S$BC 

1 

a] + BC 

AD 


1 

a) + AD 

BD 


1 

o 2 t + BD 

ABC 

S^abc 

1 

o\+ ABC 

ABD 

S$abd 

1 

al + ABD 

ACD 

SSacd 

1 

o\ + ACD 

BCD 

SS gCD 

1 

o]+ BCD 

ABCD 

SSabcd 

1 

o\ + ABCD 

Error de la subparcela (e^) 

ss SP 

12 


Tbtal 

SS T 

31 
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ques, y (para simplificar) se han usado letras mayusculas latinas para denotar los efectos de tipo fijo. Los 
efectos principals y la interaccidn de la parcela completa se prueban contra el error de la parcela com* 
pleta, mientras que los factores de la subparcela y todas las demas interacciones se prueban contra el 
error de la subparcela. Si algunos de los factores del diseno son aleatorios, los estadisticos de prueba se- 
ran diferentes. En algunos casos no habrfi ninguna prueba F exacta y debera usarse el procedimiento de 
Satterthwaite (descrito en el capitulo 12). 

Los experimentos factoriales con tres o mds factores en una estructura de parcelas subdivididas tien- 
den a ser experimentos bastante grandes. Por otra parte, la estructura de parcelas subdivididas con fre- 
cuencia facilita la realization de un experimento grande. Por ejemplo, en el caso del homo de oxidacidn, 
los experimentadores solo tienen que cambiar ocho veces los factores que son diffciles de modificar (A y 
B), por lo que quiza un experimento de 32 corridas no sea demasiado ildgico. Es posible reducir el nume- 
ro de corridas utilizando un factorial fraccionado para los factores del diseno de interes. 


13-5.2 Diseno de parcelas con doble subdivisidn 

El concepto de diseiios de parcelas subdivididas puede extenderse a situaciones en las que pueden ocurrir 
restricciones sobre la aleatorizacion en cualquier numero de niveles dentro del experimento. Si hay dos 
niveles de restricciones sobre la aleatorizaci6n, al arreglo se le llama diseno de parcelas con doble subdi- 
vision. En el ejemplo siguiente se ilustra este diseno. 


EJEMPLO 13-3 

Un investigador estudia los tiempos de absorcidn de un tipo particular de c&psula de antibibtico. Hay tres 
tecnicos, tres concentraciones de la dosis y cuatro espesores de la pared de la capsula. Cada replica de un 
experimento factorial requeriria 36 observaciones. El experimentador se ha decidido por cuatro replicas, 
y es necesario correr cada r6plica en un dia diferente. Observe que los dias pueden considerarse como 
bloques. Dentro de una replica (o un bloque) (dia), el experimento se realiza asignando una unidad de 
antibiotico aun tdcnico que lleva a cabo el experimento con las tres concentraciones de la dosis y los cua- 
tro espesores de la pared. Una vez que se ha formulado una concentration particular de la dosis, se prue- 
ban los cuatro espesores de la pared con esa concentration. Despues se selecciona otra concentracidn de 
la dosis y se prueban los cuatro espesores de la pared. Por ultimo se prueba la tercera concentration de la 
dosis y los cuatro espesores de la pared. Mientras tanto, otros dos tecnicos del laboratorio lambic n siguen 
el mismo plan, empezando cada uno con una unidad de antibiotico. 

Observe que hay dos restricciones sobre la aleatorizacion dentro de cada replica (o bloque): el tdcni- 
co y la concentration de la dosis. Las parcelas completas corresponden al tecnico. El orden en que se asig- 
nan los tecnicos a las unidades de antibiotico se determina aleatoriamente. Las concentraciones de la 
dosis forman tres subparcelas. La concentration de la dosis puede asignarse aleatoriamente a una subpar- 
cela, Por ultimo, dentro de una concentration particular de la dosis se prueban los cuatro espesores de la 
pared de la capsula de manera aleatoria, formando cuatro sub-subparcelas. A los espesores de la pared 
suele llamarseles sub-subtratamientos. Puesto que hay dos restricciones sobre la aleatorizacidn en el ex- 
perimento (algunos autores dicen que hay dos “divisiones” en el diseno), al diseno se le llama diseno de 
parcelas con doble subdivision. En la figura 13-8 se ilustran las restricciones sobre la aleatorizacion y el 
arreglo experimental de este diseno. 
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Figura 13-8 Diseno de parcelas con doble subdivision. 


Un modelo estadfstico lineal para el diseno de parcelas con doble subdivisidn es 


y» = n +r i +Pj Hrf)u +y* +(ty)» HMjk 


+**+(«*)»+(/»)* 

H*W)i % +(r d )^ +(Py d )jkh 




1 = 1, 2, r 

j— 1, 2, a 

k = 1,2, b 

h = 1, 2, c 


(13-20) 


donde r„ fy y (t (S) t j representan la parcela completa y corresponden a las replicas o bloques, a los trata- 
mientos principales (factor^) y al error de la parcela completa [replicas (o bloques) X A)], respectiva- 
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mente; y y kJ (ry) ik9 ifiy) jk y (Tfiy) ijk representan la subparcela y corresponden al tratamiento de la 
subparcela (factor f?), las interacciones de replicas (o bloques) x B y AB, y al error de la subparcela, res- 
pectivamente; y d h y los parametros restantes corresponden a la sub-subparcela y representan, respectiva- 
mente, al tratamiento de la sub-subparcela (factor C) y a las interacciones restantes. A la interaccidn de 
cuatro factores (r fiyd) ijkh se le llama el error de la sub-subparcela. 

Suponiendo que las r6plicas (bloques) son aleatorias y que los dem&s factores del diseno son fijos, 
pueden derivarse los cuadrados medios esperados como se muestra en la tabla 13-18. Las pruebas de los 
tratamientos principales, los subtratamientos, los sub-subtratamientos y sus interacciones son obvias al 
inspeccionar esta tabla. Observe que no existen pruebas para las replicas o bloques ni para las interaccio- 
nes en las que intervienen replicas o bloques. 

El analisis estadistico de un diseno de parcelas con doble subdivision es como el de una sola replica de 
un factorial de cuatro factores. El numero de grados de libertad de cada prueba se determina de la mane- 
ra usual. Para ilustrar, en el ejemplo 13-3, donde se manejaron cuatro replicas, tres tecnicos, tres concen- 
traciones de la dosis y cuatro espesores de la pared, se tendrian solo (r - 1 )(a - 1) = (4 - 1)(3 - 1) = 6 
grados de libertad del error de la parcela completa para probar a los tecnicos. Se trata de un numero rela- 
tivamente pequeno de grados de libertad, y el experimentador podria considerar el uso de replicas adicio- 


Tabla 13-48 Derivaci6n del cuadrado medio esperado para el disefio de parcelas con doble subdivisidn 



Factor 

r 

R 

i 

a 

F 

j 

b 

F 

k 

c 

F 

h 

1 

R 

l 

Cuadrado medio esperado 



1 

a 

b 

c 

1 

a 2 + abcdo l 

, . , . fi* 

a+a ' f+ <a-l> 

Parcela completa 

ft 

r 

0 

b 

c 

1 



1 

0 

b 

c 

1 

a 2 + bco 2 r0 


Subparcela 


Yk 

('ey)* 

(Pvh 


a 

a 

0 


1 a 2 + acoly + 

1 a 2 + acoly 

1 cr 2 + ccr^ + 


* c 2 r* 
(ft-i) 

*22 uw. 

(«-l)(fc-l) 



1 

0 

0 

c 

1 


&H 

r 

a 

b 

0 

1 

, . rabY 6 \ 

* + «^ + (c-1) 

(*<*)* 

1 

a 

b 

0 

1 

a 2 + abo* d 


r 

0 

b 

0 

1 

° +bG W + (a-l)(c-l) 

m ijh 

1 

0 

b 

0 

1 

o 2 + ba% i _ 

Sub-subparcela (yd)^ 

r 

a 

0 

0 

1 

f . ji . ra 22 (y d & 
a +aa ^ + ^_ 1 ^ c _ 1 - ) 


1 

a 

0 

0 

1 

° 2 + aa %i ___ 

(Py*U 

r 

0 

0 

0 

1 

+ '222 « 

** (fc-l)(c-l) 


1 

0 

0 

0 

1 

O 2 + o^, 

e Km 

1 

1 

1 

1 

1 

a 2 (no estimable) 
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Parcelas 
en frgnjas 


Figura 13-9 Una replica (bloque) de un di- 
seno de parcelas subdivididas en franjas. 


nales para incrementar la precisi6n de la prueba. Si hay a rdplicas, se tendr&n 2 (r - 1) grados de libertad 
para el error de la parcela completa. Por lo tanto, cinco replicas produciran 2(5 - 1) = 8 grados de liber- 
tad, seis replicas produciran 2(6 - 1) = 10 grados de libertad, siete replicas produciran 2(7 - 1) = 12 gra- 
dos de libertad, etcetera. Por consiguiente, es probable que el experimentador no quiera correr menos de 
cuatro replicas, ya que se producirian asi s61o cuatro grados de libertad. Cada replica adicional permite 
ganar dos grados de libertad para el error. Si se cuenta con recursos para correr cinco replicas, la preci- 
si6n de la prueba podrla incrementarse en un tercio (de seis a ocho grados de libertad). Ademds, al pasar 
de cinco a seis replicas, hay 25% de ganancia adicional en la precisidn. Si los recursos lo permiten, el expe- 
rimentador deberl correr cinco o seis rdplicas. 

13-5.3 Diseno de parcelas subdivididas en franjas 

El diseno de parcelas subdivididas en franjas ha tenido una amplia aplicacion en las ciencias agricolas, 
pero sdlo ocasionalmente encuentra un uso en la experimentacion industrial. En el caso mds simple, se 
tienen dos factoresyl yB. El factor^ se aplica a las parcelas completas como en el diseno de parcelas sub- 
divididas est&ndar. Despuds el factor B se aplica a fraiyas (que son en realidad sdlo otro conjunto de par- 


Tabla 13-19 AndUsis de varianza abreviado de un diseno de parcelas subdivididas en franjas 


Fuente de 
variacidn 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado medio esperado 

Replicas (o bloques) 

^Rdplicas 

r- 1 

o] + aba 1 . 

A 

SS A 

a - 1 

^ 1 

Error^ de la parcela completa 

S$wp A 

(r-l)(«-l) 

+ ba 2 T0 

B 

SS B 

b- 1 


Error^ de la parcela completa 

S$wp b 

(r-l)(6-l) 

°l + a<j\ 

AB 

S$ab 

(a - l)(f> - 1) 

,2 . 

* («-l)(6-l) 

Error de la subparcela 

Total 

ss SP 

SS T 

(r-l)(a-l)(6-l) 
rab - 1 

al 
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celas completas) que son ortogonales a las parcelas completas originales utilizadas para el factor^. En la 
figura 13-9 se ilustra una situacion en la que los dos factores /I y B tienen tres niveles. Observe que los ni- 
veles del factor^ estdn confundidos (o mezclados) con las parcelas completas, y que los niveles del factor 
B estan confundidos con las franjas (las cuales pueden considerarse como un segundo conjunto de parce- 
las completas). 

Un modelo para el diseno de parcelas subdivididas en franjas de la figura 13-9, suponiendo y replicas, 
a niveles del factor Ay b niveles del factor B, es 

f * — 1» 2> r 

y ii k = f i+T i +/ ? J +( r A; + Yk +0}')* +(Py)jk +E ijk \j= 1 > 2 > ■■■> a 

[k = l,2,...,b 

donde (r/% y (i y) ik son los errores de la parcela completa de los f ac tores d y B, respectivamente, y e ijk es el 
error “de la subparcela” usado para probar la interacciondf?. En la tabla 13-19 se muestra un analisis de 
varianza abreviado, suponiendo qued y B son factores fijos y que las replicas son aleatorias. En ocasiones 
las replicas se consideran como bloques. 

13-6 PROBLEMAS 

13-1. El fabricante de la carga propulsora de una turbina estfi estudiando la rapidez de combustidn del propulsor 
obtenido de tres procesos de production. Se seleccionan al azar cuatro lotes del propulsor de la salida de 
cada proceso y se hacen tres determinaciones de la rapidez de combusti6n de cada lote. Los resultados se 
presentan a continuacidn. Analizar los datos y sacar conclusiones. 


Lote 


Proceso 1 



Proceso 2 



Proceso 3 


1 

2 

3 

4 

1 

2 

3 

4 

1 

2 

3 

4 


25 

19 

15 

15 

19 

23 

18 

35 

14 

35 

38 

25 


30 

28 

17 

16 

17 

24 

21 

27 

15 

21 

54 

29 


26 

20 

14 

13 

14 

21 

17 

25 

20 

24 

50 

33 


13-2. Se estudia el acabarln superficial de piezas metalicas fabricadas en cuatro maquinas. Se conduce un experi- 
mento en el que cada nuSqiiina es operada por tres operadores diferentes y se colectan y prueban dos ejem- 
plares de cada operador. Debido a la ubicacion de las maquinas. se usan operadores diferentes en cada 
maquina, y los operadores se eligen al azar. Los datos se muestran en la tabla siguiente. Analizar los datos y 
sacar conclusiones. 



M&quina 1 



Mdquina 2 



M&quina 3 



M&quina 4 

Operador 1 

2 

3 

1 

2 

3 

1 

2 

3 

1 

2 3 

79 

94 

46 

92 

85 

76 

88 

53 

46 

36 

40 62 

62 

74 

57 

99 

79 

68 

75 

56 

57 

53 

56 47 


13-3. Un ingeniero de manufacture estS estudiando la variabilidad dimensional de un componente particular que 
se produce en tres mdquinas. Cada maquina tiene dos mandriles, y se seleccionan al azar cuatro componen- 
tes de cada mandril. Los resultados se presentan a continuacidn. Analizar los datos, suponiendo que las ma- 
quinas y los mandriles son factores fijos. 
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M&quina 1 Mdquina 2 Maquina 3 

Mandril 1 2 12 12 


12 

8 

14 

12 

14 

16 

9 

9 

15 

10 

10 

15 

11 

10 

13 

11 

12 

15 

12 

8 

14 

13 

11 

14 


13-4. Para simplificar la programacidn de la produccidn, un ingeniero industrial estd estudiando la posibilidad de 
asignar un tiempo est&ndar a una clase particular de tareas, con la creencia de que las diferencias entre las ta- 
reas son insignificantes. Para ver si esta simplificacidn es posible, se seleccionan seis tareas al azar. Cada ta- 
rea se encarga a un grupo diferente de tres operadores. Cada operador completa dos veces la tarea en 
momentos diferentes durante la semana, y se obtienen los resultados siguientes. 6 Que conclusiones pueden 
sacarse acerca del uso del tiempo estandar comun para todas las tareas de esta clase? ^Qu£ valor se usaria 
para el est&ndar? 


Threa 

Operador 1 

Operador 2 

Operador 3 

1 

158.3 

159.4 

159.2 

159,6 

158.9 

157.8 

2 

154.6 

154.9 

157.7 

156.8 

154.8 

156.3 

3 

162.5 

162.6 

161.0 

158.9 

160.5 

159.5 

4 

160.0 

158.7 

157.5 

158.9 

161.1 

158.5 

5 

156.3 

158.1 

158.3 

156.9 

157,7 

156.9 

6 

163.7 

161,0 

162.3 

160.3 

162.6 

161.8 


13-5. Considere el diseno anidado de tres etapas que se muestra en la figura 13-5 para investigar la dureza de una 
aleacidn. Utilizando los datos que se presentan a continuacidn, analizar el diseno, suponiendo que la quimi- 
ca de la aleacidn y las horaadas son factores fijos y que los lingotes son aleatorios. Usar la forma restringida 
del modelo mixto. 


Quimica de la aleacidn 


Hornadas 1 2 



1 

2 

3 


1 

2 

3 

Lingotes 

1 

2 

1 

2 

1 

2 

1 

2 

1 

2 

1 

2 


40 

27 

95 

69 

65 

78 

22 

23 

83 

75 

61 

35 


63 

30 

67 

47 

54 

45 

10 

39 

62 

64 

77 

42 


13-6. Analizar nuevamente el experimento del problema 13-5 utilizando la forma no restringida del modelo mixto. 
Comentar las diferencias que se observan entre los resultados del modelo restringido y el no restringido, 
Puede usarse un paquete de software de computadora. 

13-7. Derivar los cuadrados medios esperados para el diseno anidado balanceado de tres etapas, suponiendo que 
A es fijo y que B y C son aleatorios. Obtener las fdrmulas para estimar los componentes de la varianza. Supo- 
ner la forma restringida del modelo mixto. 

13-8. Repetir el problema 13-7 suponiendo la forma no restringida del modelo mixto, Puede usarse un paquete de 
software de computadora para hacerlo. Comentar las diferencias entre el andlisis y las conclusiones del mo- 
delo restringido y el no restringido. 

13-9. Derivar los cuadrados medios esperados para el disefio anidado balanceado de tres etapas si los tres factores 
son aleatorios, Obtener las fdrmulas para estimar los componentes de la varianza. 
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13-10, Verificar los cuadrados medios esperados que se dan en la tabla 13-1. 

13-11. Disenos anidados no balanceados . Consider e un diseno anidado de dos etapas no balanceado con bj niveles de 
B bajo el nivel z-6simo de A y n i} rdplicas en la celda z;-6sima. 

a) Anotar las ecuaciones normales de minimos cuadrados para esta situation. Resolver las ecuaciones nor- 
males. 

b ) Construir la tabla del anftlisis de varianza para el diseno anidado no balanceado de dos etapas. 

c) Analizar los datos siguientes, utilizando los resultados del inciso b. 


Factor^ 

Factor B 


1 


2 


1 

2 

1 

2 

3 


6 

-3 

5 

2 

1 


4 

1 

7 

4 

0 


8 


9 

3 

-3 




6 




13-12. Componentes de la varianza en el disefio anidado no balanceado de dos etapas. Considere el modelo 


Vijk =/“ + *"/ + Pj(i) +e *(«) 


i = l, 2, a 

7 = 1, 2 b 

k = l,2, n.. 


donde A y B son factores aleatorios. Demostrar que 

E(MS a ) = a 2 + c t a \ + c 2 a] 

E(MS B {a)) = 0 ■*" c o <7 /3 

E(MS e ) = o 2 


donde 




b ‘ 

I 

i=l \j=l 


N-l VZnt/n L 


( b, 


b—a 


E IE n l /n t. I-EE n ?i /N 

*■ i \ 7=1 / *= 1 


a— l 


N-l 4 

i=t 

N 

a — l 


13-13. Un ingeniero de procesos est& probando el rendimiento de un producto manufacturado en tres m£quinas. 
Cada maquina puede operarse con dos ajustes de la potencia. Adem£s, una mdquina tiene tres estaciones en 
las que se fabrica el producto. Se conduce un experimento en el que cada maquina se prueba con ambos ajus- 
tes de la potencia, y se toman tres observaciones del rendimiento de cada estaciOn. Las corridas se hacen en 
orden aleatorio, y los resultados se presentan a continuation. Analizar este experimento, suponiendo que los 
tres factores son fijos. 
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Estacion 


Mdquina 1 M&quina 2 Mdquina 3 

1 2 3 T~ 2 T 1 2 3 


Ajuste de la potencia 1 
Ajuste de la potencia 2 


34.1 

33.7 

36.2 

30.3 

34.9 

36.8 

31.6 

35.0 

37.1 

24.3 

28.1 

25.7 

26.3 

29.3 

26.1 

27.1 

28.6 

24.9 


31.1 

33.1 

32.8 

33.5 

34.7 

35.1 

34.0 

33.9 

34.3 

24.1 

24.1 

26.0 

25.0 

25.1 

27.1 

26.3 

27.9 

23.9 


32.9 

33.8 

33.6 

33.0 

33.4 

32.8 

33.1 

32.8 

31.7 

24.2 

23.2 

24.7 

26.1 

27.4 

22.0 

25.3 

28.0 

24.8 


13-14. Suponga que en el problema 13-13 podrfan emplearse un gran numero de ajustes de la potencia y que los dos 
que se seleccionaron para el experimento se escogieron al azar. Obtener los cuadrados medios esperados para 
esta situacidn suponiendo la forma restringida del modelo mixto y hacer las modificaciones apropiadas al 
anilisis anterior. 

13-15. Analizar nuevamente el experimento del problema 13-14 suponiendo la forma no restringida del modelo 
mixto. Puede usarse un paquete de software de computadora para hacerlo. Comentar las diferencias entre el 
andlisis y las conclusiones del modelo restringido y el no restringido. 

13-16. Un ingeniero de estructuras est£ estudiando la resistencia de una aleacion de aluminio adquirida de tres fa- 
bricates. Cada fabricante entrega la aleacidn en barras de tamano estdndar de 1.0, 1.5 o 2.0 pulgadas. El 
procesamiento de los diferentes tamanos de las barras a partir de un lingote comun implica t£cnicas diferen- 
tes de forjado, por lo que este factor puede ser importante. Adem&s, las barras se forjan de lingotes fabrica* 
dos en hornadas diferentes. Cada fabricante entrega dos ejemplares de prueba de cada tamano de las barras 
de tres hornadas. Los datos de la resistencia resultantes se presentan a continuacidn. Analizar los datos, su- 
poniendo que los fabricates y el tamano de las barras son fijos y las hornadas son aleatorias. Usar la forma 
restringida del modelo mixto. 


Hornada 

Ihmano de la barra: 1 pulgada 

1 j pulgadas 

2 pulgadas 


Fabricante 1 


1 

2 

3 

1.230 

1.346 

1.235 

1.259 

1.400 

1.206 

1.316 

1.329 

1.250 

1.300 

1.362 

1,239 

1,287 

1.346 

1.273 

1.292 

1.382 

1.215 


Fabricante 2 
1 2 3 


1.301 

1.346 

1.315 

1.263 

1.392 

1.320 

1.274 

1.384 

1,346 

1.268 

1.375 

1.357 

1.247 

1.362 

1.336 

1.215 

1.328 

1.342 


Fabricante 3 


1 

2 

3 

1.247 

1.275 

1.324 

1.296 

1.268 

1.315 

1.273 

1.260 

1.392 

1.264 

1.265 

1.364 

1.301 

1.280 

1.319 

1.262 

1.271 

1.323 


13-17. Resolver de nuevo el problema 13-16 utilizando la forma no restringida del modelo mixto. Puede usarse un 
paquete de software de computadora para hacerlo. Comentar cualquier diferencia entre el an&lisis y las con- 
clusiones del modelo restringido y el no restringido. 

13-18. Suponga que en el problema 13-16 las barras pueden adquirirse en muchos tamanos y que los tres tamanos 
que realmente se utilizaron en el experimento fueron seleccionados al azar. Obtener los cuadrados medios 
esperados para esta situation y hacer las modificaciones apropiadas al an£lisis anterior. Usar la forma res- 
tringida del modelo mixto. 

13-19. La normalizacidn del acero se hace calent&ndolo arriba de la temperatura crftica, recalentandolo y despu6s 
enfri£ndolo con aire. Este proceso incrementa la resistencia del acero, refina el grano y homogeneiza la es- 
tructura. Se lleva a cabo un experimento para determinar el efecto de la temperatura y de la duracidn del 
tratamiento t6rmico sobre la resistencia del acero normalizado. Se seleccionan dos temperaturas y tres dura- 
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ciones. El experimento se realiza calentando el homo a una temperatura seleccionada aleatoriamente e in- 
sertando tres ejemplares de prueba. Despuds de 10 minutos se retira uno de ellos, despuds de 20 minutos se 
retira un segundo ejemplar y despuds de 30 minutos se retira el ultimo. Entonces se corre la temperatura al 
otto nively se repite el proceso. Se requieren cuatto corrimientos para recabar los datos, los cuales se mues- 
tran abajo. Analizar los datos y sacar conclusiones, suponiendo que ambos factores son fijos. 


Corrimiento 

Tiempo, minutos 

Temperatura, °F 
1500 1600 


10 

63 

89 

1 

20 

54 

91 


30 

61 

62 


10 

50 

80 

2 

20 

52 

72 


30 

59 

69 


10 

48 

73 

3 

20 

74 

81 


30 

71 

69 


10 

54 

88 

4 

20 

48 

92 


30 

59 

64 


13-20. Se disena un experimento para estudiar la dispersion de los pigmentos de una pintura. Se estudian cuatro 
me ?elas diferentes de un pigmento particular. El procedimiento consiste en preparar una mezcla particular y 
en aplicarla despuds a un panel utilizando tres mdtodos (con brocha, por rocio y con rodillo). La respuesta 
medida es el porcentaje de reflectancia (coeficiente de reflexion) del pigmento. Se necesitan tres dias para 
corner el experimento, y los datos obtenidos se presentan a continuacidn. Analizar los datos y sacar conclu- 
siones, suponiendo que las mezclas y los mdtodos de aplicacion son fijos. 


Dfa 

Mdtodo de 
aplicacidn 


Mezcla 



1 

2 

3 

4 


1 

64.5 

66.3 

74.1 

66.5 

1 

2 

68.3 

69.5 

73.8 

70.0 


3 

70.3 

73.1 

78.0 

72.3 


1 

65.2 

65.0 

73.8 

64.8 

2 

2 

69.2 

70.3 

74.5 

68.3 


3 

71.2 

72.8 

79.1 

71.5 


1 

66.2 

66.5 

72.3 

67.7 

3 

2 

69.0 

69.0 

75.4 

68.6 


3 

70.8 

74.2 

80.1 

72.4 


13-21. Repetir el problema 13-20, suponiendo que las mezclas son aleatorias y que los mdtodos de aplicacidn son fi- 
jos. . 

13-22. Considere el diseno de parcelas con doble subdivision del ejemplo 13-3. Suponga que este experimento se 
conduce como se describe y que se obtienen los datos que se muestran en la siguiente tabla. Analizar los da- 
tos y sacar conclusiones. 
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T6cnico 




R6plicas 
(o bloques) 

Concentracidn 


1 



2 



3 


de las dosis 

1 

2 

3 

1 

2 

3 

l 

2 

3 


Espesor de la pared 

1 

95 

71 

108 

96 

70 

108 

95 

70 

100 

1 

2 

104 

82 

115 

99 

84 

100 

102 

81 

106 


3 

101 

85 

117 

95 

83 

105 

105 

84 

113 


4 

108 

85 

116 

97 

85 

109 

107 

87 

115 


1 

95 

78 

110 

100 

72 

104 

92 

69 

101 

2 

2 

106 

84 

109 

101 

79 

102 

100 

76 

104 


3 

103 

86 

116 

99 

80 

108 

101 

80 

109 


4 

109 

84 

no 

112 

86 

109 

108 

86 

113 


1 

96 

70 

107 

94 

66 

100 

90 

73 

98 

3 

2 

105 

81 

106 

100 

84 

101 

97 

75 

100 


3 

106 

88 

112 

104 

87 

109 

100 

82 

104 


4 

113 

90 

117 

121 

90 

117 

no 

91 

112 


1 

90 

68 

109 

98 

68 

106 

98 

72 

101 

4 

2 

100 

84 

112 

102 

81 

103 

102 

78 

105 


3 

102 

85 

115 

100 

85 

no 

105 

80 

no 


4 

114 

88 

118 

118 

85 

116 

no 

95 

120 


13-23. Resolver nuevamente el problema 13-22, suponiendo que los tecnicos se eligen al azar, Usar la forma restrin- 
gida del modelo mixto. 

13-24. Suponga que en el problema 13-22 se usaron cuatro tecnicos. Suponiendo que todos los factores son fijos, 
6Cu£ntos bloques deber&n correrse para obtener un numero adecuado de grados de libertad para probar las 
diferencias entre los tecnicos? 

13-25, Considere el experimento que se describe en el ejemplo 13-3. Demostrar c6mo se determinaria el orden en 
que se corren la combinaciones de tratamientos si este experimento se realizara como a) una parcela con do- 
ble subdivisidn, b) una parcela subdividida, c) un diseno factorial en un bloque aleatorizado y d) un diseno 
factorial completamente aleatorizado. 




Otros topicos 
de diseno y 
analisis 


El tema de los experimentos disenados estadfsticamente es muy amplio. En los capitulos previos se ha 
ofrecido una presentacidn introductoria de muchos de los conceptos y metodos basicos, aunque en algu- 
nos casos s61o se ha podido presentar un panorama general. Por ejemplo, hay exposiciones que ocupan un 
libro sobre tdpicos, como la metodologla de superficies de respuesta, los experimentos con mezclas, la es- 
timation de los componentes de la varianzay los disenos optimos. En este capitulo se presenta un panora- 
ma general de varios topicos m&s que el experimentador puede encontrar potencialmente utiles. 


14-1 RESPUESTAS Y TRANSFORMACIONES NO NORMALES 


14-1.1 Selection de una transformacidn: el metodo de Box-Cox 

En la section 3-4.3 se estudio el problema de una varianza no constante de la variable de respuesta y en 
un experimento disenado, y se senalo que se trata de una desviacion de los supuestos del analisis de va- 
rianza estdndar. Este problema de la desigualdad de la varianza ocurre con relativa frecuencia en la 
practica, muchas veces en conjuncion con una variable de respuesta no normal. Algunos ejemplos in- 
cluirfan el conteo de defectos o particulas, los datos de proporciones, como el rendimiento o la propor- 
tion de productos defectuosos, o una variable de respuesta que sigue alguna distribucidn sesgada (una 
“cola” de la distribucidn de la respuesta es mas larga que la otra). Se introdujo la transformacion de la 
variable de respuesta como un metodo apropiado para estabilizar la varianza de la respuesta. Se revisa- 
ron dos mdtodos para seleccionar la forma de la transformacidn, una tecnica grdfica empfricay un pro- 
cedimiento esencialmente de ensayo y error en el que el experimentador simplemente intenta una o 
mas transformaciones, y selecciona la que produce la grdfica mas agradable o satisfactoria de los residua- 
les contra la respuesta ajustada. 

En general, las transformaciones se usan para tres propositos: estabilizar la varianza de la respuesta, 
hacer que la distribuci6n de la variable de respuesta est6 mas cerca de la distribucion normal y mejorar el 
ajuste del modelo a los datos. Este ultimo objetivo podrfa incluir la simplificacion del modelo, por ejem- 
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plo, eliminando t6rminos de interaction. En ocasiones, una transformaciOn serd razonablemente eficaz 
para conseguir de manera simultanea mds de uno de estos objetivos. 

Se ha senalado ya que la familia de potencias de las transformacionesy * =/es muy util, donde A es el 
pardmetro de la transformation que habrd de determinarse (por ejemplo X = \ significa usar la raiz cua- 
drada de la respuesta original). Box y Cox [15] han indicado cOmo puede estimarse el pardmetro de la 
transformation A al mismo tiempo que los demds pardmetros del modelo (la media global y los efectos de 
los tratamientos). La teoria fundamental en su procedimiento utiliza el metodo de mdxima verosimilitud. 
El procedimiento de cdlculo real consiste en efectuar, para varios valores de A, el analisis de varianza es- 
tdndar de 


y 


(*) = 


y-i 

Ay ' 1-1 

>lny 


A*0 
A = 0 


(14-1) 


donde y = ln'*[(l/«) £ lny] es la media geometrica de las observaciones. La estimation de mdxima verosi- 
militud de A es el valor para el que la suma de cuadrados del error, por ejemplo SS E (X), es un rninimo. Este 
valor de A se encuentra generalmente construyendo una grdfica de SS E (X) contraA y leyendo despues en la 
grdfica el valor de A que minimiza SS E (X). En general, son suficientes entre 10 y 20 valores de A para esti- 
mar el valor Optimo. Si se necesita una estimaciOn mds precisa de A, podria realizarse una segunda itera- 
ciOn utilizando un numero mayor de valores. 

Observe que no esposible seleccionar el valor de A comparando directamente las sumas de cuadrados 
del error obtenidas en los andlisis de varianza dey*, ya que para cada valor de A la suma de cuadrados del 
error se mide en una escala diferente. Ademds, surge un problema cony cuando A = 0; a saber, cuando A 
tiende a cero,y* tiende a la unidad. Es decir, cuando A = 0, todos los valores de la respuesta son una cons- 
tante. El componente (/- 1)/A de la ecuaciOn 14-1 alivia este problema porque cuando A tiende a cero, (y* 
- 1)/A tiende a un lfmite de lny. El componente del divisor y l - 1 de la ecuaciOn 14-1 reescala las respues- 
tas para que las sumas de cuadrados del error sean comparables directamente. 

Al utilizar el mOtodo de Box-Cox, se recomienda que el experimentador use elecciones simples de A, 
ya que es probable que la diferencia practica entre A = 0.5 y A = 0.58 sea pequena, pero la transformaciOn 
de la raiz cuadrada (A = 0.5) es mucho m£s fAcil de interpretar. Obviamente, los valores de A prOximos a la 
unidad sugerirfan que no es necesaria ninguna transformaciOn. 

Una vez que se ha seleccionado un valor de A por el metodo de Box-Cox, el experimentador puede 
analizar los datos utilizando y* como la respuesta, a menos desde luego que A = 0, en cuyo caso se usa lny. 
Es perfectamente aceptable utilizar y^ como la respuesta real, aun cuando las estimaciones de los para- 
metros del modelo tendrdn una diferencia de escala y un corrimiento del origen en comparaciOn con los 
resultados obtenidos cuando se usa y* (o In y). 

Es posible encontrar un intervalo de confianza aproximado de 100(1 - a) por ciento para A calcu- 
lando 


SS' = SS E (X) (14-2) 

donde v es el numero de grados de libertad, y graficando una recta paralela al eje A a la altura SS* sobre la 
grdfica de SS E (X) contraA. Entonces, al localizar los puntos sobre el eje A donde SS* corta la curva SS E (X), 
pueden leerse directamente en la grafica los Ifmites de confianza para A. Si este intervalo de confianza in- 
cluye el valor A = 1, esto implica (como se sefialo antes) que los datos no soportan la necesidad de una 
transformaciOn. 
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EJEMPLO 

El procedimiento de Box-Cox se ilustrara utilizando los datos de la descarga pico presentados original- 
mente en el ejemplo 3-5. Recuerde que se trata de un experimento con un solo factor (ver la tabla 3-7 
para los datos originales). Utilizando la ecuacidn 14-1 se calcularon los valores de SS £ (A) para varios valo- 
res de X: 


A 

ss E 

-1.00 

7922.11 

-0.50 

687.10 

-0.25 

232.52 

0.00 

91.96 

0.25 

46.99 

0.50 

35.42 

0.75 

40.61 

1.00 

62.08 

1.25 

109.82 

1.50 

208.12 


En la figura 14-1 se muestra una gr&fica de los valores proximos al minimo, en la que se observa que 
X «0.52 produce un valor minim o de aproximadamente SS £ (A) = 35 .00. Un intervalo de confianza aproxi- 
mado de 95% paraA se encuentra calculando la cantidad SS* de la ecuacion 14-2 de la siguiente manera: 


SS* = SS £ (A) 1 + 


= 35.00 
= 42.61 


1 + 


' 0 . 025,20 

20 

(2. 086) 2 ' 
20 


Al representar SS * en la gr&fica de la figura 14-1 y al leer los puntos de la escala A donde esta recta mterse- 
ca la curva, se obtienen los limites de confianza inferior y superior de A de A' = 0.27 y A * = 0.77. Puesto que 
estos limites de confianza no incluyen el valor 1, es correcto el uso de una transformation, y la transforma- 
cion de la raiz cuadrada (A = 0.50) que se usd en realidad se justifica con facilidad. 


Algunos programas de computadora incluyen el procedimiento de Box-Cox para seleccionar una 
transformackm de la familia de potencias. En la figura 14-2 se presenta la salida de este procedimiento 
como se implementa en Design-Expert para los datos de la descarga pico. Los resultados concuerdan en 
gran medida con los cdlculos manuales resumidos en el ejemplo 14-1. Observe que la escala vertical de la 
grafica de la figura 14-2 es ln[55 E (A)]. 
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Figura 14-1 Gr&fica de SS E (X) contra A para el ejemplo 
14 - 1 . 


GrSfica de Box-Cox transformeciones de potencies 



Lambda 


Figura 14-2 Salida de Design-Expert para el procedimiento de Box-Cox. 
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14" 1 .2 Modelo lineal generalizado 

Con frecuencia las transformaciones de datos son una forma muy eficaz de abordar el problema de las 
respuestas no normales y de la desigualdad asociada de la varianza. Como se ha visto en la seccidn ante- 
rior, el m£todo de Box-Cox es una forma sencilla y eficaz de seleccionar la forma de la transformacidn. 
Sin embargo, puede haber problemas asociados con el uso de una transformacidn de datos. 

Un problema es que el experiment ador puede sentirse incdmodo al trabajar con la respuesta en la es- 
cala transformada. Es decir, el experimentador se interesa en el numero de defectos, no en la raiz cuadra- 
da del numero de defectos, o en la resistividad en lugar del logaritmo de la resistividad. Por otra parte, si 
una transformacidn en realidad tiene dxito y mejora el an&lisis y el modelo asociado de la respuesta, los 
experimentadores adoptar&n por lo general con rapidez la nueva metrica. 

Un problema m£s serio es que una transformation puede resultar en un valor sin sentido para la va- 
riable de respuesta en alguna porcidn del espatio de los factores del diseno que es de interns para el expe- 
rimentador. Por ejemplo, suponga que se ha usado la transformation de la raiz cuadrada en un 
experimento que incluye el numero de defectos observados en obleas de semiconductores, y para alguna 
portion de la regidn de interes la raiz cuadrada predicha del conteo de defectos es negativa. Es probable 
que esto suceda en situaciones en las que el ntimero real de defectos observados es pequeho. Por consi- 
guiente, el modelo del experimento ha producido una prediccidn evidentemente no confiable justo en la 
regidn donde seria deseable que este modelo tuviera un buen desempeno predictivo. 

Por ultimo, como se senalo en la seccidn 14-1.1, es frecuente el uso de transformaciones a fin de esta- 
bilizar la varianza, inducir la normalidad y simplificar el modelo. No existe la seguridad de que una trans- 
formacidn conseguira eficazmente todos estos objetivos al mismo tiempo. 

Una altemativa del enfoque tipico de la transformation de datos seguida del an&lisis estandar de mi- 
nimos cuadrados de la respuesta transformada es usar el modelo lineal generalizado. Se trata de un enfo- 
que desarrollado por Neldery Wedderburn [87] que en esencia unifica modelos lineales y no lineales con 
respuestas normales y no normales. McCullaghy Nelder [76] ofrecen un completo estudio de los modelos 
lineales generalizados y Myers y Montgomery [85b] proporcionan un tutorial. Thmbien se presentan deta- 
lles adicionales en el material suplementario del texto de este capitulo. Se ofrecerd un panorama general 
de los conceptos y se ilustrar&n con dos ejemplos breves. 

Un modelo lineal generalizado es b&sicamente un modelo de regresidn (el modelo de un diseno expe- 
rimental tambidn es un modelo de regresidn). Como todos los modelos de regresidn, esta constituido por 
un componente aleatorio (lo que se ha llamado generalmente el termino del error) y una funcidn de los 
factores del diseno (lasx) y algunos par&metros desconocidos (las/?). En un modelo de regresidn lineal de 
la teoria normal estandar se escribe 


y— $0 + + fik X k (14-3) 

donde se supone que el t6rmino del error £ tiene una distribucidn normal con media cero y varianza cons- 
tant^ y la media de la variable de respuesta y es 


E(y) = /* = p a +0 1 x 1 +p 2 x 2 +~+p k x k =x'p (144) 

A la parte x'fi de la ecuacidn 144 se le llama predictor lineal. El modelo lineal generalizado contiene la 
ecuacion 14-3 como un caso especial. 

En un modelo lineal generalizado, la variable de respuesta puede tener cualquier distribution que 
sea un miembro de la familia exponential. Esta familia incluye las distribuciones normal, de Poisson, bi- 



144 RESPUESTAS Y TRANSFORMACIONES NO NORMALES 595 


nomial, exponencial y gamma, por lo que la familia exponencial es una coleccion rica y flexible de distri- 
buciones aplicables en muchas situaciones experimentales. Ademas, la relacion entre la media de la 
respuesta /i y el predictor lineal x'fi se determina por una fimcion de enlace. 

g(/u)=x'0 (14-5) 


El modelo de regresidn que representa la respuesta media est£ dado entonces por 

E(y) = n = g-\x'p) (14-6) 

Por ejemplo, a la funciOn de enlace que lleva al modelo de regresion lineal ordinario en la ecuacion 14-3 
se le llama enlace identidad, ya que fi = g~ 1 (x'P) = x'fi. Como otro ejemplo, el enlace log (logarftmico) 

ln(f4)-x’f} (14-7) 


produce el modelo 




(14-8) 


El enlace logaritmico se usa con frecuencia con datos de conteos (respuesta de Poisson) y con respuestas 
continuas que presentan una distribution que tiene una cola larga a la derecha (la distribution exponen- 
cial o gamma). Otra funciOn de enlace importante que se usa con datos binomiales es el enlace logit 


In 



(14-9) 


Esta eleccidn de la funcidn de enlace lleva al modelo 


/* = 


1 

l+e'* 


(14-10) 


Hay muchas elecciones posibles de la funciOn de enlace, pero debe ser siempre monotona y diferenciable. 
Observe asimismo que en un modelo lineal generalizado, la varianza de la variable de respuesta no tiene 
que ser una constante; puede ser una funciOn de la media (y de las variables predictoras a traves de la fun- 
ciOn de enlace). Por ejemplo, si la respuesta es de Poisson, la varianza de la respuesta es exactamente 
igual a la media. 

Para usar un modelo lineal generalizado en la pr&ctica, el experimentador debe especificar una distri- 
bution de la respuesta y una funciOn de enlace. Despues se hace el ajuste del modelo o la estimation de 
los parametros por el mOtodo de m&rima verosimilitud, el cual para la familia exponencial resulta ser una 
version iterativa de los mfnimos cuadrados ponderados. Para los modelos de regresiOn lineal o de disenos 
experimentales ordinarios con una variable de respuesta normal, esto se reduce a los mmimos cuadrados 
estandares. Utilizando un enfoque que es analogo al analisis de varianza de datos de la teoria normal, 
pueden hacerse inferencias y la verification de diagnOsticos para un modelo lineal generalizado. Referir- 
se a Myers y Montgomery [85b] para los detalles y ejemplos. Dos paquetes de software que soportan el 
modelo lineal generalizado son SAS (PROC GENMOD) y S-PLUS. 


EJEMPLO 14-2 

El experimento de los defectos en las rejillas 

En el problema 8-29 se introdujo un experimento para estudiar los efectos de nueve factores sobre los de- 
fectos en rejillas de planchas moldeadas de recuadros abiertos. Bisgaard y Fuller realizaron un interesan- 
te y util analisis de estos datos para ilustrar el valor de la transformation de datos en un experimento 
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-0.47 (-1.82, 0.89) 
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disenado. Como se senalo en el inciso/del problema 8-29, los autores utilizaron una modificacidn de la 
transformacidn de la raiz cuadrada que llevo al modelo 


(Vy + VKl )/ 2 = 2.513— 0.996x 4 


- 1.21x b - 0.712 x 2 x 1 


donde, como de costumbre, las x representan los factores del diseno codificados. Esta transformation 
hace un excelente trabajo para estabilizar la varianza del numero de defectos. En las dos primeras seccio- 
nes de la tabla 14-1 se presenta parte de la informacidn acerca de este modelo. Bajo el encabezado 
“Tfansformados”, la primera columna contiene la respuesta predicha. Observe que hay dos valores predi- 
chos negativos. El encabezado “No transformados” presenta los valores predichos no transformados, jun- 
to con los intervalos de confianza de 95% para la respuesta media en cada uno de los 16 puntos del diseno. 
Puesto que hubo algunos valores predichos negativos, asi como limites de confianza inferiores negativos, 
no fue posible calcular los valores de todas las entradas de esta seccidn de la tabla. 

La respuesta es en esencia una raiz cuadrada del conteo de los defectos. Un valor predicho negativo 
es claramente ilogico. Observe que esto ocurre donde los conteos observados fueron pequenos. Si es itn- 
portante usar el modelo para predecir el desempeho en esta region, el modelo puede ser no confiable. 
Esto no debera tomarse como una critica del experimento original ni del analisis de Bisgaard y Fuller. Fue 
un experimento de exploration en extremo exitoso que definio con toda claridad las variables importan- 
tes del proceso. La prediccion no fue una de las metas originales, y tampoco fue el objetivo del analisis 
realizado por Bisgaard y Fuller. 

Sin embargo, si hubiera sido importante obtener un modelo de prediccion, probablemente un modelo 
lineal generalizado habria sido una buena altemativa para el enfoque de la transformacidn. Myers y 
Montgomery usan un enlace log (logaritmico) (eeuacion 14-7) y una respuesta de Poisson para ajustar 
exactamente el mismo predictor lineal dado por Bisgaard y Fuller. Esto produce el modelo 


y=e 


( 1128 - 0-896 x 4 - 1176 x 6 - 0 . 737 x 2 x n ) 


La tercera seccion de la tabla 14-1 contiene los valores predichos de este modelo y los intervalos de 
confianza de 95% para la respuesta media en cada punto del diseno (obtenida con el procedimiento 
PROC GENMOD de SAS). No hay valores predichos negativos (lo cual se asegura con la election de la 
funcidn de enlace) ni limites de confianza inferiores negativos. En la ultima seccion de la tabla se compa- 
ran las longitudes de los intervalos de confianza de 95% para la respuesta no transformada y el modelo li- 
neal generalizado (GLM). Observe que los intervalos de confianza del modelo lineal generalizado son 
uniformemente mds cortos que sus contrapartes de minimos cuadrados. Esto es un sdlido indicio de que 
el enfoque del modelo lineal generalizado ha explicado la variabilidad y ha producido un modelo superior 
en comparacidn con el enfoque de la transformacidn. 


EJEMPLO 14-3 

El experimento del hilado de estambre 

En la tabla 14-2 se presenta un diseno factorial 3 3 que se realizo para investigar el desempeho de un hilado 
de estambre bajo ciclos de carga repetida. El experimento se describe completo en Boxy Draper [16b]. La 
respuesta es el numero de ciclos hasta una falla. De manera tipica, los datos de confiabilidad como estos 
son no negativos y continuos, y con frecuencia tienen una distribucidn con una cola derecha alargada. 

Los datos se analizaron inicialmente utilizando el enfoque est&ndar (minimos cuadrados), y la trans- 
formacidn de datos fue necesaria para estabilizar la varianza. Se encuentra que el logaritmo de los datos 
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labia 14-2 El experimento del hilado de estambre 


Corrida 


*2 

*3 

Ciclos hasta 
una falla 

Logaritmo 
de los ciclos 
hasta una falla 

1 

-1 

-1 

-1 

674 

2,83 

2 

-1 

-1 

0 

370 

2.57 

3 

-1 

-1 

1 

292 

2.47 

4 

-1 

0 

-1 

338 

253 

5 

~1 

0 

0 

266 

2.42 

6 

-1 

0 

1 

210 

2.32 

7 

-1 

1 

^1 

170 

2.23 

8 

-1 

1 

0 

118 

2.07 

9 

-1 

1 

1 

90 

1.95 

10 

0 

-1 

-1 

1414 

3.15 

11 

0 

-1 

0 

1198 

3.08 

12 

0 

-1 

1 

634 

2,8 

13 

0 

0 

-1 

1022 

3.01 

14 

0 

0 

0 

620 

2.79 

15 

0 

0 

1 

438 

2.64 

16 

0 

1 

-1 

442 

2.65 

17 

0 

1 

0 

332 

2.52 

18 

0 

1 

1 

220 

2.34 

19 

1 

-1 

-1 

3636 

3.56 

20 

1 

-1 

0 

3184 

3,5 

21 

1 

-1 

1 

2000 

3.3 

22 

1 

0 

-1 

1568 

3,19 

23 

1 

0 

0 

1070 

3,03 

24 

1 

0 

1 

566 

2.75 

25 

1 

1 

-1 

1140 

3.06 

26 

1 

1 

0 

884 

2.95 

27 

1 

1 

1 

360 

2.56 


de los ciclos hasta una falla produce un modelo adecuado en terminos del ajuste global del modelo, asi 
como graficas satisfactorias de los residuales. El modelo es 

logy= 2.751 + 0.3617 jCj - 0.2739x 2 - 0.1711*., 
o en tdrminos de la respuesta original, ciclos hasta una falla, 

$/= JQ 2 - 751+0.3*171, — 0. 2739 x 2 ~ 0.1711*3 

Este experimento se analizd tambidn utilizando el modelo lineal generalizado, seleccionando la dis- 
tribucidn gamma para la respuesta y el enlace log (logaritmico). Se usd exactamente la misma forma del 
modelo encontrada por el an&lisis de minimos cuadrados de la respuesta con la transformation logaritmi- 
ca. El modelo que resultd es 


y=e 


6.3489+«.S425x, -0.6313 x 2 - 0.3851x 5 


En la tabla 14-3 se presentan los valores predichos del modelo de minim os cuadrados y del modelo lineal 
generalizado, junto con los intervalos de confianza de 95% para la respuesta media de cada uno de los 27 
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puntos del diseno. La comparacion de las longitudes de los intervalos de confianza revela que es posible 
que el modelo lineal generalizado sea un mejor predictor que el modelo de minimos cuadrados. 


Los modelos lineales generalizados han encontrado arnplia aplicacion en la investigation y el desa- 
rrollo biomedico y farmaceutico. Conforme mas paquetes de software incluyan esta capacidad, encontra- 
ra una aplicacion mas arnplia en el ambito de la investigacion y el desarrollo industrial general. 


14'2 DATOS NO BALANCEADOS EN UN DISENO FACTORIAL 

El centro de atencion principal de este libro ha sido el an&lisis de diseiios factoriales balanceados, es de- 
cir, los casos en que en cada celda hay el mismo numero n de observaciones. Sin embargo, es comun en- 
contrar situaciones en las que el numero de observaciones en las celdas son desiguales. Estos diseiios 
factoriales no balanceados ocurren por varias razones. For ejemplo, el experimentador puede haber dise- 
nado inicialmente un experimento balanceado, pero debido a problemas imprevistos euando se corre el 
experimento, los cuales resultan en la pdrdida de algunas observaciones, termina trabajando con datos no 
balanceados. Por otra parte, algunos experimentos no balanceados se disenan expresamente de este 
modo. Por ejemplo, ciertas combinaciones de tratamientos pueden ser mas costosas o mas dificiles de co- 
rrer que otras, por lo que pueden hacerse menos observaciones en esas celdas. De manera alternativa, al- 
gunas combinaciones de tratamientos pueden ser de mayor interes para el experimentador debido a que 
representan condiciones nuevas o no exploradas, por lo que puede optar por obtener replicas adicionales 
de dichas celdas. 

La propiedad de ortogonalidad de los efectos principales y las interacciones, presente en los datos ba- 
lanceados, no es valida en el caso no balanceado. Esto significa que las tecnicas del analisis de varianza 
usual no son aplicables. Por consiguiente, el an&lisis de factoriales no balanceados es mucho m&s dificil 
que el de los diseiios balanceados. 

En esta section se ofrece un breve panorama general de los metodos para abordar los factoriales no 
balanceados, centrando la atencion en el caso del modelo de efectos fijos con dos factores. Suponga que 
el numero de observaciones en la celda i/-6sima es n r Ademas, sea n, — 2‘ =1 n.. el numero de observacio- 
nes en el renglon i-esimo (el nivel i-esimo del factor A), sea n. = 2 “ =1 n :] el numero de observaciones de la 
columna;-esima (el nivel;-esimo del factor S)y sea = 2, =1 X b . =1 n. el numero total de observaciones. 


14-2.1 Datos proporcionales: un caso sencillo 

Una de las situaciones que incluye datos no balanceados presenta escasa dificultad para el analisis; se tra- 
ta del caso de los datos proporcionales. Es decir, el numero de observaciones en la celda ij-6 sima es 



n L n, 


n 


(14-11) 


Esta condicion implica que el numero de observaciones en dos renglones o columnas cualesquiera es pro- 
porcional. Cuando ocurren datos proporcionales, puede emplearse el analisis de varianza estandar. S61o 
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es necesario hacer modificaciones menores en las formulas del c£lculo manual de las sumas de cuadrados, 
las cuales quedan como 


iVl j 

SS A = ± 


1V1 j-l fc-1 

2 2 
yi y : 


5S 2 

B ^ r, n 


i - 1 « 

a A y 2 y 2 

“ 55 "“ 55fl 

5S £ =5S r -5s“- SS'-SS^ 

a 6 rt v q fr 


,=L ;=i jt^i 


i=l J-l »* 


Como un ejemplo de datos proporcionales, considere el experimento del diseno de la baterfa del 
ejemplo 5-1. En la tabla 14-4 se muestra una versidn modificada de los datos originales. Desde luego, los 
datos son proporcionales; por ejemplo, en la celda 1,1 se tienen 

_ 10(8) = 

11 " n 20 


observaciones, Los resultados que se obtienen al aplicar el anAlisis de varianza usual a estos datos se pre- 
sentan en la tabla 14-5. Tknto el tipo de material como la temperatura son significativos, lo cual concuerda 
con el an£lisis del conjunto completo de datos del ejemplo 5-1. Sin embargo, la interaccidn que se observo 
en el ejemplo 5-1 no esta presente. 


14*2*2 M6todos aproximados 

Cuando los datos no balanceados no se apartan demasiado del caso balanceado, en ocasiones es posible 
usar procedimientos aproximados que convierten el problema no balanceado en uno balanceado. Esto 


Tabla 14-4 Experimento del disefio de la baterfa con datos proporcionales 


Tipo de Ifemperatura, °F 


“I — — 

material 

15 


70 


125 




«n =4 


«12 = 4 




ft L - 10 


130 

155 

34 

40 




1 

74 

180 

80 

75 


58 

y h = 896 


n 2 1 = 2 


^ 22 “ 2 


ft 23 _ 1 



2 

159 

126 

136 

115 

45 




n 3 i = 2 


ft 32 = ^ 


M 33 ~ 1 



3 

138 

160 

150 

139 

96 




Hi = 8 


n 2 = 8 


»,3 = 4 


n = 20 


04 

04 

II 


y'x = 769 


y. 3 . = 269 
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Tabla 14-5 Andlisis de varianza de los datos del diseno de la baterfa 
de la tabla 14-4 


Fuente de 
variaciOn 

Suma de 
cuadrados 

Grados de 
libertad 

Cuadrado 

medio 

F o 

Tipos de material 

8,170.400 

2 

4,085.20 

5.00 

Temperatura 

16,090.875 

2 

8,045.44 

9.85 

Interaction 

5,907.725 

4 

1,476.93 

1.18 

Error 

8,981.000 

11 

816.45 


Tbtal 

39,150.000 

19 




hace, desde luego, que el an£lisis sea tan solo aproximado, pero el an&lisis de datos balanceados es tan 
sencillo que con frecuencia el experimentador se ve tentado a usarlo. En la pr&ctica, es necesario decidir 
cuando los datos no son lo suficientemente diferentes del caso balanceado para hacer que el grado de 
aproximacion introducido sea relativamente de escasa importancia. A continuation se describen breve- 
mente algunos de estos metodos aproximados. Se supone que todas las celdas contienen al menos una ob- 
servation (es decir, n i} >1)* 

Estimation de observaciones faltantes 

Si solo unas cuantas n tj son diferentes, un procedimiento razonable es estimar los valores faltantes, Por 
ejemplo, considere el diseno no balanceado de la tabla 14-6, Evidentemente, estimar el unico valor faltan- 
te de la celda 2,2 es un enfoque razonable. Para un modelo con interaction, la estimation del valor faltan- 
te en la celda z/'-esima que minimiza la suma de cuadrados del error es y tj . Es decir, el valor faltante se 
estima tomando el promedio de las observaciones que est&n disponibles en esa celda, 

El valor estimado se trata como un dato real La unica modification del an&lisis de varianza es reducir 
los grados de libertad del error en el numero de observaciones faltantes que se han estimado. Por ejemplo, 
si se estima el valor faltante en la celda 2,2 de la tabla 14-6, se usarfan 26 grados de libertad en lugar de 27, 


Apartado de datos 

Considere los datos de la tabla 14-7. Observe que la celda 2,2 sOlo tiene una observation mas que las otras. 
Estimar los valores faltantes de las ocho celdas restantes quizd no sea una buena idea en este caso, ya que 
esto resultaria en estimaciones equivalentes a cerca de 18% de los datos finales. Una altemativa es apar- 
tar una de las observaciones de la celda 2,2, para obtener asi un diseno balanceado con n = 4 rOplicas. 

La observation que se aparte debera elegirse al azar. Adem&s, en lugar de descartar completamente 
la observation, podrfa reintegrate al diseno, despues elegir al azar otra observation para apartarla y re- 


Tabla 14-6 Los valores n [; para un 
diseno no balanceado 


Renglones 

Columnas 

1 

2 , 

3 

1 

4 

4 

4 

2 

4 

3 

4 

3 

4 

4 

4 
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Tabla 14' 7 Los vaiores n, ; para un 
diseflo no balanceado 


Renglones 

Columnas 

1 

2 

3 

1 

4 

4 

4 

2 

4 

5 

4 

3 

4 

4 

4 


petir el an£lisis. Y, se esperaria, estos dos an&lisis no llevar&n a interpretaciones antagonicas de los datos. 
Si lo bacen, se sospecha que la observacion que se apartd es un valor atipico o disparatado y debera mane- 
jarse en consecuencia. En la pr&ctica es improbable que ocurra esta confusion cuando s61o se aparta un 
numero reducido de observaciones y la variabilidad dentro de las celdas es pequena. 

Metodo de las medias no ponderadas 

En este enfoque, introducido por Yates [113a], los promedios de las celdas se tratan como si fueran datos 
y son objeto de un analisis de datos balanceados estSndar para obtener las sumas de cuadrados de los ren- 
glones, las columnas y la interaccion. El cuadrado medio del error se encuentra como 


MS e = 



i=i >-i *= i 

n - ab 


(14-12) 


Entonces, MS E estima o 2 , la varianza dey^, una observacidn individual. Sin embargo, se ha realizado un 
analisis de varianza de los promedios de las celdas, y como la varianza del promedio de la celda ij-6 sima es 
(f/itp el cuadrado medio del error que se usa en realidad en el an&lisis de varianza debera ser una estima- 
ci6n de la varianza promedio de las y tj , por ejemplo 




VO,.)- 


1 = 1 j=l 


ab 


a b 

=^22 


i=l /= 1 


(14-13) 


Utilizando MS E de la ecuacion 14-12 para estimar o 2 en la ecuacidn 14-13, se obtiene 

MS - y y ± 
n 


MS' = , . . 

ab ££ 


(14-14) 


como el cuadrado medio del error (con n -ab grados de libertad) que se usara en el analisis de vari anza 

El m6todo de las medias no ponderadas es un procedimiento aproximado porque las sumas de cua- 
drados de los renglones, las columnas y la interaccion no se distribuyen como una variable aleatoria 
ji-cuadrada. La ventaja principal del m6todo parece ser la simplicidad de los c&lculos. Cuando las n tj no di- 
fieren de manera radical, el m6todo de las medias no ponderadas funciona con frecuencia razonablemen- 
te bien. 

Una tdcnica relacionada es el metodo de los cuadrados ponderados de las medias, propuesto tam- 
bien por Yates [113a], Esta tficnica se basa tambien en las sumas de cuadrados de las medias de las celdas, 
pero los terminus de las sumas de cuadrados se ponderan en proporcidn inversa a sus varianzas. Para ma- 
yores detalles de este procedimiento, ver Searle [99a] y Speed, asi como Hocking y Hackney [106], 
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14'2.3 Metodo exacto 


En situaciones en que los mStodos aproximados no son apropiados, como cuando ocurren celdas vacias 
(algunas = 0) o cuando las n tj presentan diferencias radicales, el experimentador debe usar un analisis 
exacto. El enfoque utilizado para desarrollar las sumas de cuadrados para probar los efectos principales y 
las interacciones consiste en representar el modelo del analisis de varianza como un modelo de regresion, 
ajustar ese modelo a los datos y usar el enfoque de la prueba general de significacidn de la regresion. Sin 
embargo, existen varias formas en que puede hacerse esto, y estos metodos pueden producir valores dife- 
rentes para las sumas de cuadrados. Ademas, las hipdtesis que se estan probando no siempre son analo- 
gos directos de las del caso balanceado, y su interpretation tampoco es siempre sencilla. Para mayor 
informacidn al respecto, ver el material suplementario del texto de este capitulo. Otras buenas referen- 
cias son Searle [99a]; Speed y Hocking [105]; Hocking y Speed [58]; Hocking, Hackney y Speed [57]; 
Speed, Hocking y Hackney [106]; Searle, Speed y Henderson [102]; Searle [99c]; y Milliken y Johnson 
[79], El software de estadistica SAS proporciona un excelente enfoque del analisis de datos no balancea- 
dos a trav6s del procedimiento PROC GLM. 


14-3 ANALISIS DE COVARIANZA 

En los capitulos 2 y 4 se introdujo el uso del principio de la formation de bloques para mejorar la preci- 
si6n con la que se hacen comparaciones entre tratamientos. La prueba t pareada fue el procedimiento 
ilustrado en el capitulo 2, mientras que en el capitulo 4 se presento el diseno de bloques aleatorizados. En 
general, el principio de la formacidn de bloques puede usarse para eliminar el efecto de los factores per- 
turbadores controlables. El andlisis de covarianza es otra tecnica que en ocasiones es util para mejorar la 
precisidn de un experimento. Suponga que en un experimento con una variable de respuestay existe otra 
variable, por ejemplox, y quey se relaciona linealmente conx. Ademds, suponga quex no puede ser con- 
trolada por el experimentador, pero puede observarse junto cony. A la variablex se le llama variable con- 
comitante o covariable. El analisis de covarianza implica ajustar la variable de respuesta observada para 
el efecto de la variable concomitante. Si no se hace este ajuste, la variable concomitante podria inflar el 
cuadrado medio del error y hacer que sean mds dificiles de detectar las verdaderas diferencias en la res- 
puesta debidas a los tratamientos. Por lo tanto, el andlisis de covarianza es un metodo de ajuste para los 
efectos de una variable perturbadora no controlable. Como se verd, el procedimiento es una combinacion 

del andlisis de varianza y del analisis de regresion. 

Como un ejemplo de un experimento en el que puede emplearse el analisis de covarianza, considere 
el estudio realizado para determinar si existe una diferencia en la resistencia de una fibra de monofila- 


Tabla 14-8 Datos de la resistencia a la ruptura (y 

y x — diflnietro en 1 0~ 3 pulgadas) 


Maquina 1 Maquina 2 


y 

X 

y 

X 

36 

20 

40 

22 

41 

25 

48 

28 

39 

24 

39 

22 

42 

25 

45 

30 

49 

32 

44 

28 

207 

126 

216 

130 


resistencia en libras 


Maquina 3 


y 

X 

35 

21 

37 

23 

42 

26 

34 

21 

32 

15 

180 

106 
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Figura 14-3 Resistencia a la ruptura (y ) contra el diametro 
de la fibra (*). 


raento producida por tres maquinas diferentes. Los datos de este experimento se muestran en la tabla 
14-8. En la figura 14-3 se presenta un diagrama de dispersion de la resistencia (y) contra el diametro (o 
grosor) de la muestra. Evidentemente, la resistencia de la fibra tambien se afecta por su grosor; por consi- 
guiente, una fibra m&s gruesa sera por lo general m£s resistente que una delgada. El analisis de covarianza 
podria usarse para eliminar el efecto del grosor (x) sobre la resistencia (y) cuando se prueban las diferen- 
cias en la resistencia entre las maquinas. 


1 4'3 . 1 Descripci6n del procedimiento 

A continuacibn se describe el procedimiento bdsico para el analisis de covarianza, ilustrandolo para un 
experimento de un solo factor con una covariable. Suponiendo que existe una relacion lineal entre la res- 
puesta y la covariable, un modelo estadistico apropiado es 

Vij = f i+T i +P(x ij -x.)+e ij ( 14 - 15 ) 

dondey iy es la observacibn y-bsima de la variable de respuesta tomada bajo el tratamiento o nivel i-6 si- 
mo del unico factor, x, y es la medicibn hecha de la covariable o variable concomitante correspondiente ay„ 
(es decir, la corrida y-e sima), x es la media de los valores x ip n es la media global, r, es el efecto del trata- 
miento i-esimo,/J es el coeficiente de regresion lineal que indica la dependencia dey, y dex v ye v es un com- 
ponente del error aleatorio. Se supone que los errores e tj son NID(0, a 2 ), que la pendiente /J * Oy que la 
verdadera relacion entre y, y yx,y es lineal, que los coeficientes de regresibn de cada tratamiento son identi- 
cos, que la suma de los efectos de los tratamientos es cero (SJ'.j r, = 0) y que la variable concomitante x :j 
no se afecta por los tratamientos. 

Observe, por la ecuacion 14-15, que el modelo del analisis de covarianza es una combinacion de los 
modelos lineales empleados en el analisis de varianza y regresion. Es decir, se tienen efectos de los tra- 
tamientos {r,}, como en un analisis de varianza de un solo factor, y un coeficiente de regresion /?, como 
en una ecuacion de regresibn. La variable concomitante de la ecuacibn 14-15 se expresa ccmo (x , y -x ) 
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en lugar dex s , para que el par&metro n se preserve como la media global. El modelo pudo haberse escri 
to como 


y, = /*'+r,+£c # +e, 


i = 1,2 
j = l,2,...,n 


(14-16) 


donde fi ' es una constante diferente de la media global, que para este modelo es/ 4 ' + fix . Es mas comun 
encontrar la ecuacidn 14-15 en la literatura sobre el tema. 

Para describir el an&lisis, se introduce la siguiente notation: 


1-1 jm 1 f=l 1 Un 

(14-17) 

ft n an 2 

(14-18) 

= 1*.-* XJi-JD-SS 

i-1 j=l i=x M 

(14-19) 


(14-20) 

T,.n\ (J,-i 

M n M an 

(14-21) 

T v = - *. )(?,. - y .. ) = - S (*/. )(>’.. ) an 

1=1 1=1 

(14-22) 

t=l 7=1 

(14-23) 

E ~ = SE ( x o -*i. ) 2 = “ r » 

i= 1 j = 1 

(14-24) 

E v = E 2 (*• “ Ky* S v - T *y 

(14-25) 


.=1 j-i 


Observe que, en general, S = T + E, donde los simbolos S, TyE se usan para denotar las sumas de cuadra- 
dos y los productos cruzados del total, los tratamientos y el error, respectivamente. Las sumas de cuadrados 
dexyy deben ser no negativas; sin embargo, las sumas de los productos cruzados (xy) pueden ser negativas. 

A continuation se indica la forma en que el analisis de covarianza ajusta la variable de respuesta para 
el efecto de la covariable. Considere el modelo completo (ecuacion 14-15). Los estimadores de minimos 
cuadrados de fi, r, y son ft = y„ , i , = y L - y„ - fi{x L - x ), y 



(14-26) 


La s um a de cuadrados del error en este modelo es 

SS E = E yy -(E v ) 2 /E xx 


con a(n - 1) - 1 grados de libertad. La varianza del error experimental se estima con 

SS, 


(14-27) 



14-3 anAlisis de covarianza 607 


Suponga ahora que no hay ningun efecto de los tratamientos. El modelo (ccuacion 14-15) seria entonces 

yq =M+0(x ij -x )+e l] (14-28) 

y puede demostrarse que los estimadores de mfnimos cuadrados de /t y £ son £ = y y /j = S^JS a . La suma 
de cuadrados del error en este modelo reducido es 


ss; = 


'(^) 2 /5 i 


(14-29) 


con an- 2 grados de libertad. En la ecuaci6n 14-29, la cantidad (5^) 2 /5« es la reducci6n de la suma de cua- 
drados dey obtenida a trav6s de la regresidn lineal dey sobre x. AdemSs, observe que SS E es menor que 
SB's [y a ^e el modelo (ecuacidn 14-15) contiene los parimetros adicionales {r ( >] y que la cantidad SS' E - 
SS E es una reduccidn en la suma de cuadrados debida a las {r,}. Por lo tanto, la diferencia entre SS' E y SS E , 
es decir, SS E — SS E , proporciona una suma de cuadrados con a — 1 grados de libertad para probar la hipo- 
tesis de que no hay ningun efecto de los tratamientos. Por consiguiente, para probar H 0 ^ = 0, se calcula 


_ (55;-^ £ )/( fl -i) 
SS E /[«(«-!)-!] 


(14-30) 


que, si la hip6tesis nula es verdadera, se distribuye como F a _ a( „ . 1} . v Por lo tanto, H 0 : r, * 0 se rechaza si 
Fo > F a ,i> - 1 , a(n - 1 ) - 1 - Thmbten podria usarse el enfoque del valor P. 

Es instructivo examinar la presentacidn de la tabla 14-9. En ella el analisis de covarianza se ha presen- 
tado como un an&lisis de varianza “ajustado”. En la columna de la fuente de variaci6n, la variabilidad to- 
tal se mide por con an - 1 grados de libertad. La fuente de variation “regresion” tiene la suma de 
cuadrados (S v ) 2 /S,, con un grado de libertad. Si no hubiera ninguna variable concomitante, se tendria S v 
= S ia = E v = E a = 0. Entonces la suma de cuadrados del error seria simplemente y la suma de cuadra- 
dos de los tratamientos seria S yy -E yy = 7 Sin embargo, debido a la presencia de la variable concomitan- 
te, Syy y E y y deben “ajustarse” para la regresidn dey sobre x, como se muestra en la tabla 14-9. La suma de 
cuadrados del error ajustada tiene a(n - 1) - 1 grados de libertad en lugar de a(n 4 1) grados de libertad 
debido a que se ajusta un parfmetro adicional (la pendiente /S) a los datos. ' 

Los cSlculos suelen presentarse en una tabla del analisis de covarianza como la tabla 14-10. Se em- 
plea esta presentation porque resume de manera conveniente todas las sumas de cuadrados y los produc- 
tos cruzados requeridos, asi como las sumas de cuadrados para probar las hipdtesis acerca de los efectos 
de los tratamientos. Adem&s de utilizarla para probar la hipdtesis de que no hay diferencias en los efectos 
de los tratamientos, con frecuencia esta tabla se encuentra util en la interpretation de los datos para pre- 
sentar las medias de los tratamientos ajustadas. Estas medias ajustadas se calculan de acuerdo con 

y L ajustada = y. -/?(*, -X ) t = l,2,...,a (14-31) 

donde p = / E a . Esta media de los tratamientos ajustada es el estimador de mfnim os cuadrados de 

M + r ;> i = 1, 2, a, en el modelo (ecuacidn 14-15). El error est&ndar de cualquier media ajustada de los 
tratamientos es 


J y i ajustada 


^ \ 2 \ 


MS (I + 2oL> 

U E . 


-|l/2 


(14-32) 
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Tratamientos ajustados 
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Por ultimo, cabe recordar que se ha supuesto que el coeficiente de regresion /J del modelo (ecuacidn 
14-15) es diferente de cero. La hipotesis H 0 :fi = 0 puede probarse utilizando el estadfstico de prueba 


^0 = 


(^) 2 /g* 

MS. 


(14-33) 


que bajo la hipdtesis nula se distribuye como F l tt(n _ 1} _ 1# Por lo tanto, H 0 fi = 0 se rechaza si F 0 > F a _ h 

a(n - 1 ) - 1 * 


EJEMPLO 14-4 

Considere el experimento descrito al principio de la section 14-3. Ties m&quinas producen una fibra de 
monofilamento en una f&brica textil. El ingeniero del proceso tiene interns en determinar si existe alguna 
diferencia en la resistencia a la ruptura de la fibra producida por las tres m&quinas, Sin embargo, la resis- 
tencia de una fibra se relaciona con su didmetro, con las fibras m&s gruesas, siendo estas, en general, m&s 
resistentes que las m£s delgadas. Se selecciona una muestra aleatoria de cinco ejemplares de prueba de fi- 
bra de cada maquina. En la tabla 14-8 se muestra la resistencia de la fibra (y) y el di&metro correspondien- 
te (x) de cada ejemplar. 

El diagrama de dispersidn de la resistencia a la ruptura contra el di&metro de la fibra (figura 14-3) in- 
dica una clara tendencia a una relation lineal entre la resistencia a la ruptura y el di&metro, y parece apro- 
piado eliminar el efecto del di&metro sobre la resistencia mediante un an&lisis de covarianza. Suponiendo 
que la relacion lineal entre la resistencia a la ruptura y el diametro es apropiada, el modelo es 




[* = 1,2,3 
U = 1, 2,..., 5 


Utilizando las ecuaciones 14-17 a 14-25, pueden calcularse 

5 »“22 yl “TT * C 36 ) 2 +(41) 2 + ■ +(32) 3 


i=i >=i 
3 5 


(603) 2 
(3)(5) 


= 346.40 


•*» = 22 A ~^= ( 2 °) 2 +( 25 ) 2 + - + ( 15 )' 261 - 73 


/=1 fm 1 
3 5 


^ = 22 - 


(OOP 


an 


= (20)(36)+(25)(41)+ ... +(15)(32) 


(362)(603) 

W 28Z6 ° 


T „ = ^2 yl |[(207) 2 +(216) 2 +(180) 2 ]-®1 = 140.40 


/=! 

3 


(3)(5) 


„ 1 , x l 1 , , , (362) 2 

T « ="2 x l -^ = 3K 126 ) + ( 13 °) +( 106)2 ]-^-= 66.13 


l-l 

3 


n i=i 

(362)(603) 

(3)(5) 


(OOP 1 


an 


= -[(126)(207)+(130)(216)+(106)(184)] 


= 96.00 
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E„ = s w -T„ = 346.40-140.40 = 206.00 
E =5 ~T a = 261.73- 66.13= 195.60 
E *y = S *y-T*y = 282.60 - 96.00 = 186.60 

Por la ecuacidn 14-29 se encuentra 

SS^S„-(SJ 2 /S a 

■ 346.40-(186.60) 2 / 261.73 
= 41.27 


con an- 2 = (3)(5) - 2 = 13 grados de libertad; y por la ecuacion 14-27 se encuentra 

SS E = E yy -(E v ) 2 /E„ 

= 206.00- (186.60) 2 / 195.60 
= 27.99 

con a(n - 1) - 1 = 3(5 - 1) - 1 = 11 grados de libertad. 

La suma de cuadrados para probar H 0 :t 1 = t 2 ~ r 3 = 0 es 

SS' E -SS E = 41.27 - 27.99 
= 13.28 


con a-l = 3- l = 2 grados de libertad. Estos c^lculos se resumen en la tabla 14-11. 

Para probar la hipdtesis de que las m^quinas difieren en la resistencia a la ruptura de la fibra produci- 
da, es decir, H Q .T i = 0, por la ecuacidn 14-30 el estadistico de la prueba se calcula como 

_ (55;-55 £ )/(a-l) 

0 SS E /[a(n— 1)— 1] 

13.28/2 _ 6. 64 _ 261 
27.99 /U 2.54 


A1 comparar este valor con F 0 u = 2.86, se encuentra que no puede rechazarse la hipotesis nula. El va- 
lor P de este estadistico de la prueba es P = 0.1181. Por lo tanto, no hay evidencia solida de que las fibras 
producidas por las tres maquinas difieran en la resistencia a la ruptura. 

La estimaddn del coeficiente de regresidn se calcula con la ecuacion 14-26 como 



186.60 

195.60 


= 0.9540 


La hip6tesis // 0 :/3 = 0 puede probarse usando la ecuacion 14-33. El estadistico de prueba es 

p ) 2 / E- _ (186. 60) 2 / 195.60 _ QS 

0 MS e 2.54 

y puesto que F 0 . 01i 1; u = 9.65, se rechaza la hipdtesis de que p = 0. Por lo tanto, existe una relacidn lineal 
entre la resistencia a la ruptura y el diametro, y el ajuste proporcionado por el analisis de covarianza fue 


necesano. 
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Las medias de los tratamientos ajustadas pueden calcularse con la ecuacion 14-31. Estas medias ajus- 
tadas son 

%. ajustada = y l - 0(* L ~ x . ) 

= 41.40- (0.9540)(25.20 - 24.13) = 40.38 

% ajustada = y 2 - /l(x 2 . - x ) 

= 43.20- (0.9540)(26.00- 24.13) = 41.42 


y 


y 3 ajustada = y 3 -0(x 3 -x ) 

= 36.00- (0.9540)(21.20 - 24.13)= 38.80 


A1 comparar las medias ajustadas con las medias no ajustadas de los tratamientos (lasy, ), se observa que 
las medias ajustadas se encuentran mucho mas proximas entre si, una indication mas de que el analisis de 
covarianza fue necesario. 

Un supuesto basico en el analisis de covarianza es que los tratamientos no influyen en la covariable x, 
ya que la t6cnica elimina el efecto de las variaciones en las x L . Sin embargo, si la variabilidad en las x t se 
debe en parte a los tratamientos, entonces el analisis de covarianza elimina parte del efecto de los trata- 
mientos. Por lo tanto, deberii tenerse una seguridad razonable de que los tratamientos no afectan los va- 
loresjq,. En algunos experimentos esto puede ser obvio a partir de la naturaleza de la covariable, mientras 
que en otros puede ser mas dudoso. En el ejemplo tratado aqui puede haber una diferencia en el diimetro 
de la fibra (x tj ) entre las tres ntiquinas. En tales casos, Cochran y Cox [26] sugieren la posible utilidad de 
un analisis de varianza de los valoresx, y para determinar la validez de este supuesto. Para el problema tra- 
tado aqui, con este procedimiento se obtiene 

F = 66 - 13/2 = 1H 7 = 2.03 
0 195.60/12 16.30 


que es menor que .Fo. 10 , 2,12 = 2.81, por lo que no hay razon para creer que las m&quinas producen fibras con 
diametros diferentes. 


La verificacidn del diagnostico del modelo de covarianza se basa en el analisis residual. Para el mode- 
lo de covarianza, los residuales son 

donde los valores ajustados son 

% = A+f, +h x tj -*..)= y.. +[y, - y. - h*, ~ *. )] 

+k x i i - x .)=y,. + h x , I - x ,) 

Por lo tanto, 

«# = y>i - Vi. - h x ,j - X L ) ( 14 ‘ 34 ) 

Para ilustrar el uso de la ecuaci6n 14-34, el residual de la primera observaci6n de la primera maquina 
del ejemplo 14-4 es 

e n = y n - y L - K x n ~\)= 36- 41.4- (0.9540)(20- 25.2) 

= 36- 36.4392 = -0.4392 
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En la tabla siguiente se presenta una lista completa de las observations, los valores ajustados y los 
residuales: 


Valor observado^ 

Valor ajustado y tj 

Residual e v =y ij ~% 

36 

36.4392 

-0.4392 

41 

41.2092 

-0.2092 

39 

40.2552 

-1.2552 

42 

41.2092 

0.7908 

49 

47.8871 

1.1129 

40 

39.3840 

0.6160 

48 

45.1079 

2.8921 

39 

39,3840 

-0.3840 

45 

47.0159 

-2.0159 

44 

45.1079 

-1.1079 

35 

35,8092 

-0.8092 

37 

37.7171 

-0.7171 

42 

40.5791 

1.4209 

34 

35.8092 

-1.8092 

32 

30.0852 

1,9148 


Los residuales se grafican contra los valores ajustados y tj en la figura 14-4, contra la covariable x tj en la fi- 
gura 14-5 y contra las ntiquinas en la figura 14-6. En la figura 14-7 se muestra la grafica de probabilidad 
normal de los residuales. Estas graficas no revelan ninguna desviacion importante de los supuestos, por lo 
que se concluye que el modelo de covarianza (ecuacion 14-15) es apropiado para los datos de la resisten- 
cia a la ruptura. 

Es interesante observar lo que habria ocurrido en este experimento si no se hubiera realizado el ana- 
lisis de covarianza, es decir, si los datos de la resistencia a la ruptura (y) se hubieran analizado como un ex- 
perimento de un solo factor en el que se ignorarala co variables. En la tabla 14-12 se muestra el an&lisis de 
varianza de los datos de la resistencia a la ruptura. Se concluiria, con base en este analisis, que las m&qui- 
nas difieren significativamente en la resistencia de la fibra producida. Es exactamente la conclusion 



25 30 35 40 45 50 




Figura 14-4 Gr&fica de los residuales contra los valores ajus- 
tados del ejemplo 14-4. 
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Figura 14-5 Gr£fica de los residuales contra el di£metro x de 
la fibra en el ejemplo 14-4. 


opuesta del an&lisis de covarianza. Si se sospechara que las m&quinas difieren significativamente en su 
efecto sobre la resistencia de la fibra, entonces se intentaria igualar la resistencia producida por las tres 
m&quinas. Sin embargo, en este problema las m&quinas no difieren en la resistencia de la fibra producida 
despu6s de que se elimina el efecto lineal del di&metro. Seria conveniente reducir la variabilidad del dift- 
metro de la fibra dentro de las m£quinas, ya que con esto probablemente se reduciria la variabilidad de la 
resistencia de la fibra. 

1 4"3 *2 Solucion por computadora 

Se cuenta con varios paquetes de software que pueden realizar el analisis de covarianza. En la tabla 14-13 
se muestra la salida del procedimiento General Linear Models (modelos lineales generales) de Minitab 



Figura 14-6 Grftfica de los residuales contra las 
m£quinas. 
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Residuales, e ^ 


Figura 14-7 Gr£fica de probabilidad normal de los residuales del ejemplo 14-4. 


para los datos del ejemplo 14-4. Esta salida es muy similar a las que se presentaron anteriormente. En la 
secci6n de la salida bajo el encabezado “Andlisis de varianza” (“Analysis of variance”), “SS Seq” corres- 
ponde a la partition “secuencial” de la suma de cuadrados del modelo global, es decir, 

SS (Modelo) = SS (Diametro) + SS(Maquina | Diametro) 

= 305.13+13.28 
= 318.41 

mientras que “SS ajustada” corresponde a la suma de cuadrados “extra” para cada factor, es decir, 

55(M^quina | Diametro) = 13.28 


y 


55(Di^metro |M&quina) = 178.01 


Observe que 55(Maquina | Diametro) es la suma de cuadrados que debera usarse para probar que no hay 
ningun efecto de la mdquina, y que .V.S’(Di;imetro | Maquina) es la suma de cuadrados corregida que debe- 
ra usarse para probar la hipotesis de que ft = 0. Los estadisticos de la prueba de la tabla 14-13 difieren li- 
geramente de los que se calcularon manualmente debido al redondeo. 


Tabla 14-12 An&lisis incorrecto de los datos de la resistencia a la ruptura como un experimento de un solo factor 


Fuente de 
variacidn 

Suma de cuadrados 

Grados de 
libertad 

Cuadrado medio 

F o 

Valor F 

MSquinas 

140.40 

2 

70.20 

4.09 

0.0442 

Enor 

206.00 

12 

17.17 



Tbtal 

346.40 

14 
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Tabla 14' 13 Salida de Minitab (an&lisis de covarianza) del ejemplo 14-4 
Modelo lineal general 


Factor Type Levels Values 

Machine fixed 3123 


Analysis 

of Variance for Strength, using 

Adjusted SS for Tests 

Source 

DF Seq SS 

Adj SS 

Adj MS F P 

D i ameter 

1 305.13 

178.01 

178.01 69.97 0.000 

Machine 

2 13.28 

13.28 

6.64 2.61 0.118 

Error 

Total 

11 27.99 

14 346.40 

27.99 

2.54 

Term 

Coef StDev 

T 

P 

Constant 

17.177 2.783 

6.17 

0.000 

D i ameter 
Machine 

0.9540 0.1140 

8.36 

0.000 

1 

0.1824 0.5950 

0.31 

0.765 

2 

1.2192 0.6201 

1 .97 

0.075 


Means for Covariates 


Covariate Mean StDev 

Diameter 24.13 4.324 


Least Squares Means for Strength 


Machine 

1 

2 

3 


Mean StDev 
40.38 0.7236 
41 .42 0.7444 
38.80 0.7879 


El programa calcula tambien las medias de los tratamientos ajustadas con la ecuacion 14-31 (Minitab 
hace referenda a estas como las medias de minimos cuadrados en la salida muestral) y los errores estan- 
dar, El programa comparard asimismo todos los pares de medias de tratamientos utilizando los procedi- 
mientos de comparacidn multiple por pares estudiados en el capitulo 3. 


14*3*3 Desarrollo mediante la prueba general de significacidn de la regresion 

Es posible desarrollar formalmente el procedimiento para probar H 0 :r i = 0 en el modelo de covarianza 

y* = ^ +r - + P( x ‘i ) +f # {) = ItZn (14_35) 

utilizando la prueba general de significacidn de la regresion. Considere la estimacion de los parametros 
del modelo (ecuacidn 14-15) por minimos cuadrados. La funcion de minimos cuadrados es 

>=i ;= 1 


(14-36) 
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y a partir de dL/dfi - dL/dr, = dL/d/S = 0, se obtienen las ecuaciones normales 


fi:anfi+n £ r. = y 
1=1 

71 

T.infi+ni , (jc # -*..)=y, i = 1,2,..., a 

y=i 

(*,--* )+^=^ 

.=i y-i 


(14-37a) 

(14-37b) 

(14-37c) 


A1 sumar las a ecuaciones de la ecuacion 14-37b, se obtiene la ecuacion 14-37a porque 2? =1 2“ =1 (x t/ - 
x ) = 0, por lo que existe una dependencia lineal en las ecuaciones normales. Por lo tanto, es necesario au- 
mentar las ecuaciones 14-37 con una ecuacion linealmente independiente para obtener una solution. 
Una condition logica es Z, =i i i = 0. 

A1 utilizar esta condickm, de la ecuaci6n 14-37a se obtiene 

fi - y (14-38a) 

y de la ecuacidn 14-37b 

(14-38b) 


La ecuacidn 14-37c puede reescribirse como 

On an 


2 (y,-y.. )2 ( x ij - >2 ( X ij- X ..) + P s 


= 5, 


despu6s de sustituir para t,. Pero se observa que 

E (ft - ft )E ( X ij- X .)=T V 

■= i /- 1 


y 


a 


n 


2 ( x i~ x . )E (*„-*) =r « 

•=i j = i 


Por lo tanto, la soluci6n de la ecuacidn 14-37c es 



que fue el resultado dado anteriormente en la seccidn 14-3.1 en la ecuacidn 14-26* 

La reduccidn en la suma de cuadrados total debida al ajuste del modelo (ecuacidn 14-15) puede ex- 
presarse como 


a 

R(fi, x, /?)= fty_ +2 T,y,. +PS V 

i = 1 

a 

= (ft )y. +2 [ft. - ft. - (£> / e„ Xft. - ft )]y, +{ £ v / 

r=l 


= y 2 /an+X (ft “ft )ft “(3, /*„)2 (ft. "ft )y L +(£* IE a )S v 

•ytlan+T n -{E„IE„W*-S v ) 

= y* lan+T^+iE ^) 2 / £„ 
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Esta suma de cuadrados tiene a + 1 grados de libertad porque el rango de las ecuaciones normales es 
a + 1. La suma de cuadrados del error de este modelo es 


i = l J = i 

= 22 yl-y 1 .lan-T^{E^flE ; 
= sJ-T„-{E„? I E„ 

~ Eyy -(E ^) 2 / E^ 


(14-39) 


con an - (a + 1) = a(n - 1) - 1 grados de libertad. Esta cantidad se obtuvo anteriormente como la ecua- 
cion 14-27. 

Considere ahora el modelo restringido a la hipotesis nula, es decir, a i/ 0 :r j = r 2 = . . . = r a = 0. Este 
modelo reducido es 


y 9 = V+P( x i i -x..)+£ ij 


i = 1,2,..., a 
J = l,2,...,n 


(14-40) 


Se trata de un modelo de regresion lineal simple, y las ecuaciones normales de mmimos cuadrados para 
este modelo sou 

anju = y , (14-41a) 

fe„=S v (14-41b) 

Las soluciones de estas ecuaciones son fi = yyfi- SJS^; y la reduccion en la suma de cuadrados total 
debida al ajuste del modelo reducido es 

R(fi, p)-fky _+P$ v 

= (y. )y.+( s v is„)s v 

= y 2 /an+(S v ) 2 /S„ < 14 ' 42 ) 


Esta suma de cuadrados tiene dos grados de libertad. 

La suma de cuadrados apropiada para probar H 0 :r 1 = t 2 = . . . — r a = 0 puede encontrarse como 

f})=R(ti,T, pyRfa p) 

= t Ian+T v +(E V ) 2 /E„-y 2 / an-(S v ) 2 / 5^ 

= S„- (S„ ) 2 / S„ - [E„ - ) 2 / E a ] (14-43) 

utilizando T yy = S yy -E yy . Observe que R(r \ n , £) tiene a + 1 - 2 = a - 1 gr ados de libertad y que es identica 
a la suma de cuadrados dada por SS E - SS E en la section 14-3.1. Por lo tanto, el estadistico de prueba para 
7f 0 :T, = 0 es 

RW^ma- 1) (SS' E -SS E )/(a-l) 

0 5S £ /[a(n-l)-l] SS £ /[«(»-!)-!] 


expresion que se dio anteriormente como la ecuacion 14-30. Por lo tanto, utilizando la prueba general de 
significacion de la regresidn, se ha justificado el desarrollo heuristico del analisis de covarianza de la sec- 
cion 14-3.1. 
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14"3*4 Experimentos factoriales con covariables 


El andlisis de covarianza puede aplicarse a estructuras de tratamientos m&$ complejas, como los disenos 
factoriales. Siempre que existan datos suficientes para cada combinacidn de tratamientos, practicamente 
cualquier estructura de tratamientos compleja puede analizarse mediante el enfoque del analisis de cova- 
rianza. A continuacidn se indica c6mo podria usarse el analisis de covarianza en la familia m&s comun de 
disenos factoriales utilizados en la experimentacidn industrial, los factoriales 2 k , 

A1 establecer el supuesto de que la covariable afecta a la variable de respuesta de manera iddntica 
para todas las combinaciones de tratamientos, podria construirse una tabla del an&lisis de covarianza si- 
milar al procedimiento dado en la seccidn 14-3.1. La unica diferencia seria la suma de cuadrados de los 
tratamientos. Para un factorial 2 2 con n replicas, la suma de cuadrados de los tratamientos (7^) seria (1 In) 
s , 2 =i 2^ yfj - y 2 /(2)(2)n. Esta cantidad es la suma de las sumas de cuadrados de los factores^, B y la in- 
teraction A8. Entonces podria hacerse laparticidn de la suma de cuadrados ajustada de los tratamientos 
en componentes de los efectos individuales, e$ decir, la suma de cuadrados de los efectos principales ajus- 
tados SS A y SS B , y una suma de cuadrados de la interaction, 55^. 

El numero de replicas es un aspecto clave cuando se amplia la estructura de los tratamientos del dise- 
no. Considere un arreglo factorial 2 3 . Se necesita un minimo de dos replicas para evaluar todas las combi- 
naciones de tratamientos con una covariable separada para cada combinacidn de tratamientos. (una 
covariable por interaccidn de tratamientos). Esto es equivalente a ajustar un modelo de regresidn simple 
a cada combinacidn de tratamientos o celda del diseno, Con dos observaciones por celda, un grado de li- 
bertad se usa para estimar la ordenada al origen (el efecto del tratamiento), y el otro se usa para estimar la 
pendiente (el efecto de la covariable). Con este modelo saturado, no se cuenta con ningun grado de liber- 
tad para estimar el error, Por lo tanto, se necesitan al menos tres rdplicas para un analisis de covarianza 
completo, suponiendo el caso mas general. Este problema se agudiza cuando se incrementa el numero de 
celdas distintas del diseno (combinaciones de tratamientos) y las covariables. 

Si el numero de rdplicas est& limitado, pueden hacerse varios supuestos para permitir un an&lisis util. 
El supuesto mas simple (y tipicamente el peor) que puede hacerse es que la covariable no tiene ningun 
efecto. Si la covariable, incorrectamente, deja de tomarse en consideracidn, el an&lisis completo y las con- 
clusiones subsecuentes podrian tener graves errores. Otra eleccidn es suponer que no hay ningun trata- 
miento por interaccidn de la covariable. Aun cuando este supuesto sea incorrecto, el efecto promedio de 
la covariable en todos los tratamientos seguira incrementando la precisidn de la estimacidn y la prueba de 
los efectos de los tratamientos. Una desventaja de este supuesto es que si varios niveles de los tratamien- 
tos interactuan con la covariable, los diferentes terminos pueden cancelarse entre siy el t6rmino de la co- 
variable, si se estima solo sin ninguna interaccidn, puede resultar no significativo. Una tercera election 
seria suponer que algunos de los factores (como algunas interacciones de dos factores y de drdenes supe- 
riores) no son significativos. Esto permite usar parte de los grados de libertad para estimar el error. Sin 
embargo, este curso de accidn debera emprenderse con cuidado, y los modelos subsecuentes deber&n 
evaluarse a profundidad, ya que la estimacidn del error ser£ relativamente imprecisa a menos que se le 
asignen suficientes grados de libertad. Con dos rdplicas, cada uno de estos supuestos liberar& algunos gra- 
dos de libertad para estimar el error y permitird realizar pruebas de hipotesis litiles. El supuesto que se es- 
tablecera debera ser dictado por la situation experimental y por el riesgo que el experimentador este 
dispuesto a correr, Cabe hacer notar que en la estrategia de construccidn del modelo de los efectos, si se 
elimina el factor de uno de los tratamientos, entonces las dos “replicas” resultantes de cada factorial 2 3 
original no son en realidad r6plicas. Estas “replicas ocultas” liberan grados de libertad para la estimatidn 
de parametros, pero no deberftn usarse como replicas para estimar el error puro porque la ejecucidn del 
diseno original quizd no se haya aleatorizado para ello. 
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Tabla 14-14 Datos de la respuesta y la covariable para un disefio 2 3 con 
2 replicas 


A B c * y 


-1 

-1 

1 

-1 

-1 

1 

1 

1 

-1 

-1 

1 

-1 

-1 

1 

1 

1 

-1 

-1 

1 

-1 

-1 

1 

1 

1 

-1 

-1 

1 

-1 

-1 

1 

1 

1 


-1 

4,05 

-30,73 

-1 

0.36 

9.07 

-1 

5.03 

39.72 

-1 

1.96 

16.30 

1 

5.38 

-26.39 

1 

8.63 

54.58 

1 

4.10 

44.54 

1 

11.44 

66.20 

-1 

3.58 

-26.46 

-1 

1.06 

10,94 

-1 

15.53 

103.01 

-1 

2.92 

20.44 

1 

2.48 

-8.94 

1 

13.64 

73.72 

1 

-0.67 

15.89 

1 

5.13 

38.57 


Para ilustrar algunas de estas ideas, considere el diseiio factorial 2 3 con dos replicas y una covariable 
que se muestra en la tabla 14-14. Si la variable de respuesta y se analiza sin tomar en cuenta la covariable, 
resulta el siguiente modelo: 

y= 25.03+11.20A+18.05.B+7.24C-18.91A.B+14.80AC 

El modelo global es significativo en el nivel de a = 0.01 con R 2 = 0.786 y MS E = 470.82. El analisis residual 
no indica problemas con este modelo, excepto porque la observation con y = 103.01 es inusual. 

Si se elige el segundo supuesto, que las pendientes son comunes con ningun tratamiento por interac- 
ci6n de la covariable, pueden estimarse el modelo de los efectos completo y el efecto de la covariable. La 
salida de Minitab (de la rutina General Linear Models) se muestra en la tabla 14-15. Observe que MS E se 
ha reducido considerablemente al tomar en consideration la covariable. El analisis final resultante des- 
puds de eliminar de manera secuendal cada interaccidn no significativa y el efecto principal C se muestra 
en la tabla 14-16. Este modelo reducido proporciona un MS E todavia menor que el modelo completo con 
la covariable de la tabla 14-15. 

Por ultimo, podria considerarse un tercer curso de action, suponiendo que ciertos tdrminos de in- 
teraction son insignificantes. Se considera el modelo completo que permite pendientes diferentes entre 
los tratamientos y la interaction tratamiento por covariable. Se supone que no son significativas las in- 
teracciones de tres factores (tanto ABC como ABCx) y se usan los grados de libertad asociados con ellas 
para estimar el error en el modelo de los efectos mas general que pueda ajustarse. Este es con frecuencia 
un supuesto practice. Las interacciones de tres factores son por lo general insignificantes en la mayoria de 
los ambientes experimentales. La version actual de Minitab no puede modelar covariables que interac- 
tuan con los tratamientos, por lo que se usa PROC GLM de SAS. Las sumas de cuadrados tipo III son las 
sumas de cuadrados ajustadas que se necesitan. En la tabla 14-17 se presentan los resultados de SAS para 
este modelo. 

Con un modelo casi saturado, la estimation del error sera bastante imprecisa. Incluso cuando unos 
cuantos tenninos son individualmente significativos en el nivel a = 0.05, el sentido general es que este 
modelo es mejor que los dos escenarios previos (basados en R 2 y el cuadrado medio del error). Debido a 
que el aspecto de los efectos de los tratamientos del modelo es de mayor interns, se eliminan de manera 
secuencial tdrminos de la porci6n de la covariable del modelo a fin de agregar grados de libertad para esti- 
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Tabla 14-15 AnSlisis de covarianza dc Minitab para el experimento de la tabla 14-14, suponiendo una 
pendiente comun 

Modelo lineal general 


Factor Type Levels Values 

A fixed 2 -1 1 

B fixed 2 -1 1 

C fixed 2 -1 1 


Analysis of Variance for y, using Adjusted SS for Tests 


Source 

OF 

Seq SS 

Adj SS 

Adj MS 

F 

p 

X 

1 

12155.9 

2521 .6 

2521 . 6 

28.10 

0.001 

A 

1 

1320.7 

1403.8 

1403.8 

15.64 

0.005 

B 

1 

3997.6 

4066.2 

4066.2 

45.31 

0.000 

C 

1 

52.7 

82.3 

82.3 

0.92 

0.370 

A*B 

1 

3788.3 

3641.0 

3641 .0 

40.58 

0.000 

A * C 

1 

10.2 

1.1 

1 . 1 

0.01 

0.913 

B*C 

1 

5.2 

8.4 

8.4 

0.09 

0.769 

A*B*C 

1 

33.2 

33.2 

33.2 

0.37 

0.562 

Error 

7 

628.1 

628.1 

89.7 



Total 

15 

21992.0 





Term 


Coef StDev 

T 

P 



Constant 

-1 

.016 5.454 

-0.19 

0.858 



X 

4. 

9245 0.9290 

5.30 

0.001 




mar el error. Si se elimina secuencialmente el t6rmino^Cx seguido de BCx, el MS E decrece a 0.7336 y va- 
rios t6rminos no son significativos. En la tabla 14-18 se muestra el modelo final despues de eliminar 
secuencialmente Cx, AC y BC. 

Este ejemplo destaca la necesidad de contar con grados de libertad para estimar el error experimen- 
tal a fin de incrementar la precision de las pruebas de hipotesis asociadas con los t6rminos individuales 
del modelo. Este proceso deber& hacerse de manera secuencial para evitar la eliminacidn de terminos sig- 
nificativos enmascarados por una estimation pobre del error. 


Tabla 14-16 AnSlisis de covarianza de Minitab, modelo reducido para el experimento de la tabla 14-14 
Modelo lineal general 


Factor Type Levels Values 

A fixed 2 -1 1 

B fixed 2-1 1 


Analysis of Variance for y, using Adjusted SS for Tests 


Source 

DF 

Seq SS 

Adj SS 

Adj MS 

F 

P 

X 

1 

12155.9 

8287.9 

8287.9 

119.43 

0.000 

A 

1 

1320.7 

1404.7 

1404.7 

20.24 

0.001 

B 

1 

3997.6 

4097.7 

4097.7 

59.05 

0.000 

A*B 

1 

3754.5 

3754.5 

3754.5 

54.10 

0.000 

Error 

11 

763.3 

763.3 

69.4 



Total 

15 

21992.0 





Term 


Coef StDev 

T 

P 



Constant 

-1 

.878 3.225 

-0.58 

0.572 



X 

5. 

0876 0.4655 

10.93 

0.000 
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labia 14-18 Salida de PROC GLM de SAS para el experimento de la tabla 14-14, modelo reduc ido 

Dependent Variable: Y 
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BX 3.0340997 26.05 0.0001 0.11647626 

ABX -3.0342229 -25.86 0.0001 0.11732045 


.624 capitulo 14 otros tOpicos de diseno y anAusis 

Al revisar los resultados obtenidos de los tres enfoques, se observa que cada metodo mejora de mane- 
ra sucesiva el ajuste del modelo en este ejemplo. Si hay una razon fundada para creer que la covariable no 
interactua con los factores, quizd sea mejor establecer ese supuesto desde el principio del analisis. Esta 
option tambien puede ser dictada por el software. Aun cuando los paquetes de software para disenos ex- 
perimentales quiza s61o tengan capacidad para modelar covariables que no interactuan con los trata- 
mientos, el analista puede tener una oportunidad razonable de identificar los factores principales que 
influyen en el proceso, incluso si hay alguna covariable por interaction de tratamientos. Se observa asi- 
mismo que las pruebas usuales de la adecuacion del modelo siguen siendo apropiadas y se recomiendan 
energicamente como parte del proceso de construction del modelo del analisis de covarianza ANCOVA. 


14-4 MEDICIONES REPETIDAS 

En el trabajo experimental de las ciencias sociales y el comportamiento, asi como en algunos aspectos de 
la ingenieriay las ciencias fisicas, las unidades experimentales son con frecuencia personas. Debido a las 
discrepancias en experiencia, capacitacion o formation, en algunas situaciones experimentales las dife- 
rencias en las respuestas de distintas personas al mismo tratamiento pueden ser muy grandes. A menos 
que este controlada, esta variabilidad entre las personas se convertira en parte del error experimental, y 
en algunos casos inflara significativamente el cuadrado medio del error, haciendo mas dificil detectar las 
diferencias reales entre los tratamientos. 

Es posible controlar esta variabilidad entre las personas utilizando un diseno en el que cada uno de 
los a tratamientos se usa en cada persona (o “sujeto”). A 6ste se le llama diseno de mediciones repetidas. 
En esta seccion se ofrece una breve introduction a los experimentos de mediciones repetidas con un solo 
factor. 

Suponga que un experimento incluye a tratamientos y que cada tratamiento se va a usar exactamente 
una sola vez en cada uno de n sujetos. Los datos aparecerian como en la tabla 14-19. Vea que la observa- 
tion y,-,- representa la respuesta del sujeto j al tratamiento i y que solo se usan n sujetos. El modelo que se 
utiliza para este diseno es 

y^/t+Ti+Pj+s, (14-45) 

donde r f es el efecto del tratamiento i-6simo y /3 ; es un parametro asociado con el sujeto j-6simo. Se supone 
que los tratamientos son fijos (de donde = 0) y que los sujetos empleados son una muestra aleato- 
ria de alguna poblacion mas grande de individuos potentiates. Por lo tanto, colectivamente los sujetos re- 
presentan un efecto aleatorio, por lo que se supone que la media de /i, es cero y que la varianza de /3, es o . 
Puesto que el tdrmino p } es comun a todas las a mediciones del mismo sujeto, la covarianza entre y, y yy, 7 no 


Tabla 14-19 Datos de 

un disefio de mediciones repetidas con un solo factor 



Ttatamiento 

1 

Sujeto 

2 

n 

Totales de 
los tratamientos 

1 


yn 

ym 

yj. 

2 

^21 

y ?2 

y^ 

y? 

a 

y a i 

y a2 

y a n 

y*. 

Ibtales de los sujetos 

y. i 

y. 2 

y.n 

y.. 
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es, en general, cero. Se acostumbra suponer que la covarianza entre y,y y y rj es constante a lo largo de todos 
los tratamientos y los sujetos. 

Considere una particidn en el an£lisis de varianza de la suma de cuadrados total, por ejemplo 

ES (y,-y.) J “«E (y.j-y..) 2+ ES (y #-^) 1 ( 14 - 46 ) 

i=l ;=1 M i'= 1 j= 1 


El primer t6rmino del miembro derecho de la ecuacion 14-46 puede considerarse como una suma de cua- 
drados que resulta de las diferencias entre los sujetos , y el segundo t6rmino es una suma de cuadrados de 
las diferencias dentro de los sujetos. Es decir, 


SS T 


= SS 


Entre los sujetos 


+55 


Dentro de los sujetos 


Las sumas de cuadrados SS Bntrc lossujetos y SS DtntI0 dc loa sujetos son estadisticamente independientes, con grados 
de libertad 


an - 1 = (n-l)+n(a-l) 


Las diferencias dentro de los sujetos dependen tanto de las diferencias en los efectos de los trata- 
mientos como de la variabilidad no controlada (ruido o error). Por lo tanto, la suma de cuadrados resul- 
tante de las diferencias dentro de los sujetos puede descomponerse de la siguiente manera: 


EE (>v - y->¥ = n E Oi. - y.. ) 2 +EE (y# - ft. - y.i +?.. ) 2 


(14-47) 


El primer termino del miembro derecho de la ecuacion 14-47 mide la contribucion de la diferencia entre 
las medias de los tratamientos a 55^^ de , os sujetos , y el segundo termino es la variation residual debida al 
error. Ambos componentes de 55 Dtntro de los sujetos son independientes. Por lo tanto, 

cc = cc _i_ cc 

Dentro de los Sujetos ° J Tratamientos ^ ^ E 

con los grados de libertad dados por 

n(a-l) = (a-l)+(u — l)(n-l) 

respectivamente. 

Para probar la hipdtesis de que no hay ningun efecto de los tratamientos, es decir, 

H 0 :t 1 = t 2 = ■■■ = t„ = 0 
//, : Al menos una r ; ^ 0 


se usaria el cociente 


’ ^^TratamieDtos ^ jv) _ ^^TralaimcDtos 

0_ SS E /(a-l)(n- 1)“ MS e 


(14-48) 


Si los errores del modelo siguen una distribution normal, entonces bajo la hipdtesis nula, H 0 : r, = 0, el es- 
tadistico F 0 sigue una distribucion F a 1)(n _ 1)f La hipotesis nula se rechazaria siF 0 > F aa _ h(a _ l)(n _ iy 
En la tabla 14-20 se resume el procedimiento del analisis de varianza, donde se presentan tambien 
fdrmulas convenientes de c&lculo para las sumas de cuadrados. El lector debera identificar el an&lisis de 
varianza de un diseno de un solo factor con mediciones repetidas como el equivalente del an&lisis de un 
diseno de bloques completos aleatorizados, donde los sujetos se consideran como los bloques. 
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14-5 PROBLEMAS 627 


14-5 PROBLEMAS — 

14-1. Considere nuevamente el problema 5-22. Usar el procedimiento de Box-Cox para determinar si es apropiada 
(o util) una transformacidn de la respuesta para analizar los datos de este experimento. 

14-2. En el ejemplo 6-3 se selecciond una transformacidn logaritmica para la respuesta velocidad de avance de una 
perforadora. Usar el procedimiento de Box-Cox para demostrar que se trata de una transformacidn de datos 
apropiada. 

14-3. Considere de nuevo el experimento del proceso de fundicion del problema 8-23, donde se uso un diseno fac- 
torial fraccionado 2 6-3 para estudiar el peso del material de empaque que se adhiere a £nodos de carbono 
despuds de la coccidn. Se hicieron tres rdplicas de las ocho corridas del diseno, y el peso promedio y el rango 
de los pesos de cada combinacidn de prueba se trataron como las variables de respuesta, i,Existe algun indi- 
cio de que se necesite una transformacidn para cualquiera de las dos respuestas? 

14-4. En el problema 8-24 se usd un diseno factorial fraccionado con rdplicas para estudiar el abombamiento o 
combadura del sustrato en la fabricacidn de semiconductores, Se usaron como variables de respuesta tanto la 
media como la desviacidn estdndar de las mediciones de la combadura. £Existe algun indicio de que se nece- 
site una transformacidn para cualquiera de las dos respuestas? 

14-5. Considere nuevamente el experimento del recubrimiento fotoprotector del problema 8-25. Usar la varianza 
del espesor del recubrimiento en cada combinacidn de prueba como la variable de respuesta. 6Existe algun 
indicio de que se necesite una transformacidn? 

14-6. En el experimento defectos en la rejilla del problema 8-29 se empled una variante de la transformacidn de la 
raiz cuadrada en el analisis de los datos. Usar el mdtodo de Box- Cox para determinar si dsta es la transforma- 
cidn apropiada. 

14-7. En el diseno central compuesto del problema 11-14 se obtuvieron dos respuestas, la media y la varianza del 
espesor del dxido. Usar el mdtodo de Box-Cox para investigar la utilidad potencial de una transformacidn 
para estas dos respuestas. 6Es apropiada la transformacidn logaritmica sugerida en el inciso c de ese proble- 
ma? 

14-8. En el diseno factorial 3 3 del problema 11-33, una de las respuestas es la desviacidn est£ndar. Usar el mdtodo 
de Box-Cox para investigar la utilidad de las transformaciones para esta respuesta. £Cambiaria su contesta- 
cidn si se usara la varianza como la respuesta? 

14-9. En el problema 11-34 se sugiere usar ln(5 2 ) como la respuesta (referirse al inciso b). 6E1 metodo de Box-Cox 
indica que es apropiada una transformacidn? 

14-10. Un distributor de bebidas gaseosas est£ estudiando la efectividad de los mdtodos de descarga. Se han desa- 
rrollado tres tipos diferentes de carretillas, y se lleva a cabo un experimento en el laboratorio de ingenierfa de 
mdtodos de la companfa. La variable de interds es el tiempo de descarga en minutos (y); sin embargo, el tiem- 
po de descarga tambidn guarda una estrecha relacidn con el volumen de las cajas descargadas (x). Cada ca- 
rretilla se usd cuatro veces y se obtuvieron los datos siguientes. Analizar estos datos y sacar las conclusiones 
apropiadas. Utilizar a = 0.05. 


Tipo de carretilla 


L 


l 


$ 

y 

X 

y 

X 

>> 

X 

27 

24 

25 

26 

40 

38 

44 

40 

35 

32 

22 

26 

33 

35 

46 

42 

53 

50 

41 

40 

26 

25 

18 

20 


14-11. Calcular las medias ajustadas de los tratamientos y los errores estdndar de dstas para los datos del problema 
14-10. 

14-12. A continuacidn se presentan las sumas de cuadrados y los productos de un analisis de covarianza de un solo 
factor. Terminar el analisis y sacar las conclusiones apropiadas, Utilizar a - 0.05. 
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I. Distribuci6n normal estftndar acumulada* 
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a Reproducida con permiso de Probability and Statistics in Engineering and Management Science } 3a. ed., W.W, 
Hines y D.C. Montgomery, Wiley, Nueva York 
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L Distribuci6n normal estdndar acumulada ( contmuacuin ) 
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II* Puntos porcentuales de la distribucidn t d 
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4.541 
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7.453 
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.741 
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2.776 

3.747 
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.727 

1,476 

2.015 

2.571 
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4.773 

5.893 

6.869 
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1,440 

1.943 

2.447 

3.143 

3,707 

4.317 

5.208 

5.959 

7 
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.711 

1.415 

1.895 

2.365 

2.998 

3,499 

4.019 

4.785 

5.408 

8 

.262 

.706 

1.397 

1,860 

2,306 

2.896 

3.355 

3.833 

4.501 

5.041 

9 

.261 

.703 

1.383 

1,833 

2,262 

2.821 

3.250 

3,690 

4.297 

4,781 

10 

.260 

.700 

1.372 

1.812 

2,228 

2.764 

3.169 

3.581 

4,144 

4.587 

11 

.260 

.697 

1.363 

1.796 

2.201 

2.718 

3.106 

3.497 

4.025 

4.437 

12 

.259 

.695 

1.356 

1.782 

2.179 

2.681 

3.055 

3,428 

3.930 

4.318 

13 

.259 

.694 

1,350 

1.771 

2.160 

2.650 

3.012 

3,372 

3.852 

4.221 

14 

.258 

.692 

1.345 

1,761 

2.145 

2.624 

2.977 

3.326 

3.787 

4,140 

15 

.258 

.691 

1,341 

1.753 

2.131 

2.602 

2.947 

3,286 

3.733 

4.073 

16 

.258 

.690 

1,337 

1.746 

2.120 

2.583 

2.921 

3.252 

3.686 

4.015 

17 

.257 

.689 

1.333 

1.740 

2.110 

2.567 

2.898 

3.222 

3.646 

3.965 

18 

.257 

,688 

1,330 

1.734 

2.101 

2.552 

2.878 

3.197 

3.610 

3.922 

19 

.257 

.688 

1,328 

1.729 

2.093 

2.539 

2.861 

3.174 

3.579 

3.883 

20 

.257 

.687 

1.325 

1.725 

2.086 

2.528 

2.845 

3,153 

3.552 

3.850 

21 

.257 

.686 

1.323 

1,721 

2.080 

2.518 

2.831 

3.135 

3.527 

3.819 

22 

.256 

.686 

1.321 

1.717 

2,074 

2.508 

2.819 

3.119 

3,505 

3.792 

23 

.256 

.685 

1.319 

1.714 

2.069 

2.500 

2,807 

3.104 

3.485 

3.767 

24 

.256 

,685 

1,318 

1.711 

2.064 

2.492 

2.797 

3.091 

3.467 

3.745 

25 

.256 

,684 

1.316 

1.708 

2.060 

2.485 

2.787 

3.078 

3.450 

3.725 

26 

.256 

.684 

1.315 

1.706 

2.056 

2.479 

2.779 

3.067 

3.435 

3.707 

27 

.256 

.684 

1.314 

1.703 

2,052 

2,473 

2.771 

3.057 

3.421 

3.690 

28 

.256 

.683 

1.313 

1.701 

2,048 

2,467 

2.763 

3.047 

3.408 

3.674 

29 

.256 

.683 

1.311 

1,699 

2.045 

2,462 

2.756 

3.038 

3.396 

3.659 

30 

,256 

.683 

1.310 

1.697 

2.042 

2.457 

2.750 

3,030 

3.385 

3.646 

40 

.255 

.681 

1.303 

1.684 

2.021 

2.423 

2.704 

2.971 

3.307 

3.551 

60 

.254 

.679 

1.296 

1.671 

2.000 

2.390 

2.660 

2.915 

3.232 

3.460 

120 

.254 

.677 

1.289 

1,658 

1,980 

2.358 

2.617 

2.860 

3.160 

3.373 

00 

.253 

.674 

1.282 

1,645 

1.960 

2,326 

2.576 

2.807 

3,090 

3.291 


v = grados de libertad. 

fl Adaptada con permiso de Biometrika Tables for Statisticians, vol. 1, 3a. ed., E.S. Pearson y H.O. Hartley, 
Cambridge University Press, Cambridge 
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HL Puntos porcentuales de la distribucidn % l a 
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*995 

.990 

.975 
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.950 

.500 

.050 

.025 

.010 

,005 

1 

0.00 + 

0.00 + 

0.00 + 

0,00 + 

0.45 

3.84 

5.02 

6.63 

7.88 

2 

0.01 

0.02 

0.05 

0.10 

1.39 

5.99 

7.38 

9.21 

10.60 

3 

0.07 

0,11 

0.22 

0.35 

2.37 

7,81 

9.35 

11.34 

12,84 

4 

0.21 

0.30 

0.48 

0.71 

3.36 

9.49 

11.14 

13.28 

14.86 

5 

0*41 

0-55 

0,83 

1.15 

4.35 

11.07 

12.38 

15.09 

16.75 

6 

0-68 

0.87 

1.24 

1.64 

5,35 

12.59 

14.45 

16.81 

18.55 

7 

0.99 

1.24 

1.69 

2.17 

6.35 

14.07 

16.01 

18.48 

20.28 

8 

1.34 

1.65 

2.18 

2.73 

7.34 

15.51 

17.53 

20.09 

21.96 

9 

1-73 

2.09 

2.70 

3,33 

8.34 

16.92 

19,02 

21.67 

23.59 

10 

2,16 

2.56 

3,25 

3.94 

9.34 

18.31 

20.48 

23.21 

25.19 

11 

2.60 

3.05 

3.82 

4,57 

10.34 

19,68 

21.92 

24.72 

26.76 

12 

3.07 

3,57 

4.40 

5.23 

11.34 

2L03 

23.34 

26.22 

28.30 

13 

3,57 

4.11 

5.01 

5.89 

12,34 

22.36 

24.74 

27.69 

29.82 

14 

4.07 

4.66 

5.63 

6.57 

13.34 

23,68 

26.12 

29.14 

31.32 

15 

4.60 

5.23 

6.27 

7.26 

14.34 

25,00 

27.49 

30.58 

32.80 

16 

5.14 

5,81 

6.91 

7.96 

15.34 

26,30 

28.85 

32.00 

34.27 

17 

5.70 

6.41 

7.56 

8.67 

16.34 

27.59 

30.19 

33.41 

35.72 

18 

6.26 

7.01 

8.23 

9,39 

17.34 

28.87 

31.53 

34.81 

37.16 

19 

6.84 

7,63 

8.91 

10.12 

18.34 

30,14 

32.85 

36.19 

38.58 

20 

7.43 

8.26 

9,59 

10.85 

19.34 

31.41 

34.17 

37.57 

40.00 

25 

10.52 

11.52 

13.12 

14,61 

24,34 

37.65 

40.65 

44,31 

46.93 

30 

13.79 

14.95 

16,79 

18.49 

29.34 

43.77 

46.98 

50.89 

53-67 

40 

20.71 

22.16 

24,43 

26.51 

39.34 

55.76 

59.34 

63.69 

66.77 

50 

27.99 

29.71 

32.36 

34.76 

49.33 

67.50 

71.42 

76.15 

79.49 

60 

35.53 

37.48 

40.48 

43.19 

59.33 

79.08 

83.30 

88.38 

91,95 

70 

43.28 

45.44 

48.76 

51.74 

69,33 

90.53 

95.02 

100.42 

104.22 

80 

51.17 

53.54 

57.15 

60.39 

79.33 

101.88 

106.63 

112.33 

116.32 

90 

59,20 

61,75 

65.65 

69.13 

89.33 

113.14 

118.14 

124,12 

128.30 

100 

67.33 

70.06 

74.22 

77.93 

99.33 

124.34 

129.56 

135.81 

140,17 


v = grados de libertad 


“Adaptada con penniso de Biometrika Tables for Statisticians, vol. 1, 3a, ed,, E.S. Pearson y H.O. Hartley, 
Cambridge University Press, Cambridge 




Puntos porcentuales de la distribution F 
F 

r 0.15,v l ,v 2 

Grados de libertad del numerador 


m oo r- » r- 'if to eo m oo in cn O oo 10 ^ fn cn O ^ w cc h « m m -*r t cn <n oi Wi o O 

oo r- i£> *n m ^ ^ tJ- ^ m <n ?n «n <n cn N N m m (s (S <s iN M M 

8 a n n ri ^ ^ ^ ~ ~ i ^ ~ ~ ^ ^ ^ — — — ; ^ 

Or^r^og r*~ ^ m oo m * ^ n « * C" m tn « - o o-. » ® « « W; ifl t ^ (s n bj 

O oo ^ ^ o oo r-yS IT) in t 7 ^ t ^ rn rn rn tn cn cn rn ni ni ni <n <n <vi in rN ni (N — — O 


'O ^ f — oo tj- ir, ^ ^ o r- Tt O » ^ rs — • ® o o\ oc oo t— t-^ ^ <o r i o >0 r» 

r- ^ tt c « y) it. i?j m tt 4 tt m r, ft rt ^ m trj W M n c* <N cl n m n - - ^ 
vo a n « pi — i — ' — i — * -h ^ ^ — ; — — « ^ ^ ^ ^ „ ^ — : ™ ™ ^ ^ 


^ I h t p oc r*^ v5 *n in nn ^ ^ ^ ^ en #n rn rn tn rt a rt n a m « ^ n m r*i 


tn tn \£> oo oo m r~ ® O c* oi r* - Ov oo r^ vC m ^ tn m ci cn —i ~h a ® * « t ® 

\o t t o oo r- <o ® vj ^ tt en rn m m rn n% m cn « « ^ ^ ^ ri ri h 

^ t?\ m' cm rs — i — i ^h' — ~ ; ^-i ^ — : ^ ™ ^ _j ^ 


m cn cn -n cn m fj <s w — 


O rn ri O 


I Tf m tT O « r- \q 

9\ r; m ri _; w ^ 


r-i aj Tt oo ov f- ^ n ov in M o m « un 5 m fM o a o> « « t' c ® ^ i/\ m ® oo >n 

m m tt o at i> « « ^ m, it, in rf ^ Tj‘^‘Tj i TfTt t? m m m rn rnrn^^fn m m *n cs r} 


® O' ffl W fS 


•® Ot rt H (S 


f' Ov m N (N — 


I * m t>- o 00 r - N « « w m m m m 

00 ri ri r -i ™ 


^ « m rt rt 


■'T I 00 m <"i — ( — * 


0000 ® ir, \p o fl m ®«'ou-)tn n — < — • o ® a> w o? ^ *£ ^ t CJ Q 

vS ® cs» ® ao ^ <5 « $ «n « « tf. »n in in in ^ ^ ^ ri; <1; 'rr ^ t ^ 1; ^ 

<n t^ n n m — ^ ™ ^ ^ ^ — — — — ^ ^ ^ ^ ^ ™ — 


— 1 <s tn Tt ir> 


•’'■“* 2 = 222 22222 S S 9 S 3 SSSSS SSSS 


( z /t) jopEUiuiouap jap pEpaqp ap sopEiQ 


642 



Puntos porcentuales de la distribution F ( contmuaddn ) 

Fq.^ l ^ 

Grades de libertad del numerador (vj) 



Pantos porcentuales de la distribution F (cmtinuacion) 
F 

__ r 0 . 05 h v L ,vj 

Grados de libertad del numerador (rj 
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Puntos porcentuales de ta distribuci 6 n F ( continuation ) 

p 

r 0 - 025 ,v t 

Grados de libertad del numerador (v,) 
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Puntos porcentuales de la distribucion F (ccmtin i 

fil .01.» L >2 

Grados de libertad del numerador (v L ) 
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7,56 539 451 4.02 3.70 3.47 3 3 0 3.17 3.07 2,98 2.84 2.70 2.55 2.47 239 230 2.21 2 ,U 2.01 

731 538 431 3.83 3.51 3,29 332 2,99 2.89 2,80 2.66 252 2.37 2.29 2.20 23! 2.02 1,92 1.80 

7.08 4,98 4 3 3 3.65 3.34 33 2 2.95 2.82 2.72 2.63 2.50 2.35 2.20 2.12 2.03 1.94 1.84 1.73 1,60 

6,85 4,79 3.95 3.48 337 2.96 2.79 2,66 2.56 2.47 2 3 4 2 3 9 2.03 1.95 1.S6 1.76 1,66 153 138 

6.63 4.61 3,78 3.32 3 02 2.80 2,64 251 2.41 23 2 2 3 8 2.04 1,88 1,79 1.70 1.59 1,47 1,32 1.00 
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V Curvas de operacidn caracteristica para el anSlisis de varianza del modelo con efectos fijos- 




. 1 I 1IW 1M\\ 

1 2 3 < — 4* (para a = .05) 

^ (para a = ,01) » 1 2 3 4 5 

*>1 = grades de libertad del numerador, v z = grados de llbertad del denominador. 


"Adaptada con penniso de Biometrika Tables for Statisticians, vol. 2, E.S. Pearson y H.O, Hartley, Cambridge 
University Press, Cambridge 
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648 APENDICE 


V. Curvas de operaci6n caracteristica para el an&lisis de varianza 
del modelo con efectos fijos (continuacidn) 






AFENDICE 649 


V. Curvas de operacitin caracterfstica para el an&lisis de varianza 
del modelo con efectos fijos ( cominnacidn ) 
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650 APENDICE 


V* Curvas de operacidn caracterfstica para el an&llsis de varianza 
del modelo con efectos fijos (cannnuad6r\) 






Probabilidad de aceptar las hipdtesis Probabilidad de aceptar las hipdtesis 


AFENDICE 651 


VI* Curvas de operacidn caracterfstica para el an&lisis de varianza 
del modelo con efectos aleatorios d 




“Reproducida con permiso de Engineering Statistics , 2a. ed„ A.H. Bowker y G .J. Ueberman, Prentice-Hall 
Lie,, Englewood Cliffs, NJ. 


Probabi! idad de acepta r las hi pdtesis Proba bi I [dad de acepta r las hi pdtesis 


652 APENDICE 


VI. Curvas de operaci6n caracterfstica para el anSlisis de varianza del 
modelo con efectos aleatorios (continuaadn) 







Probability de aceptar las hipbtesis Probabilidad de aceptar las hipbtesis 


VI. Curvas de operaci6n caracterfstica para el andlisis de varianza del 
modelo con efectos aleatorios ( continuacidn ) 
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VL Curvas de operaci6n caracteristica para el an&lisis de vananza del 
modelo con efectos aleatorios (continuacidn) 
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VIL Rangos significativos para la prueba del rango multiple de Duncan fl 
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IX. Valores criticos para la prueba de Dunne tt para comparar tratamientos con un control 0 

^0 .05 b /) 

Comparaciones de dos colas 


f 


a - 1 = 

= numero de medias de tratamientos (sin incluir el control) 


1 

2 

3 

4 

5 

6 

7 

8 

9 

5 

2.57 

3.03 

3.29 

3.48 

3.62 

3.73 

3.82 

3.90 

3.97 

6 

2.45 

2.86 

3,10 

3.26 

3.39 

3.49 

3.57 

3.64 

3.71 

7 

2.36 

2.75 

2.97 

3.12 

3.24 

3.33 

3.41 

3.47 

3.53 

S 

2.31 

2.67 

2.88 

3.02 

3.13 

3.22 

3.29 

3.35 

3.41 

9 

2.26 

2.61 

2.81 

2.95 

3.05 

3.14 

3.20 

3.26 

3.32 

10 

2.23 

2.57 

2.76 

2.89 

2.99 

3.07 

3.14 

3.19 

3.24 

11 

2.20 

2.53 

2,72 

2.84 

2.94 

3.02 

3.08 

3.14 

3.19 

12 

2.18 

2,50 

2,68 

2,81 

2.90 

2.98 

3.04 

3.09 

3.14 

13 

2.16 

2.48 

2,65 

2.78 

2.87 

2.94 

3.00 

3.06 

3,10 

14 

2.14 

2.46 

2.63 

2.75 

2.84 

2.91 

2.97 

3.02 

3.07 

15 

2.13 

2.44 

2.61 

2.73 

2,82 

2.89 

2.95 

3.00 

3.04 

16 

2,12 

2.42 

2.59 

2.71 

2.80 

2.87 

2.92 

2.97 

3.02 

17 

2.11 

2.41 

2.58 

2.69 

2.78 

2,85 

2.90 

2.95 

3.00 

18 

2.10 

2.40 

2.56 

2.68 

2.76 

2.83 

2.89 

2.94 

2.98 

19 

2.09 

2.39 

2.55 

2.66 

2.75 

2.81 

2.87 

2.92 

2.96 

20 

2.09 

2.38 

2,54 

2,65 

2.73 

2,80 

2.86 

2.90 

2.95 

24 

2.06 

2.35 

2.51 

2,61 

2.70 

2.76 

2.81 

2.86 

2.90 

30 

2.04 

2.32 

2,47 

2,58 

2,66 

2.72 

2.77 

2,82 

2.86 

40 

2.02 

2.29 

2.44 

2.54 

2.62 

2.68 

2.73 

2.77 

2.81 

60 

2.00 

2.27 

2.41 

2.51 

2.58 

2,64 

2.69 

2.73 

2.77 

120 

1.98 

2.24 

2.38 

2.47 

2.55 

2,60 

2.65 

2.69 

2.73 

O0 

1,96 

2.21 

2,35 

2,44 

2.51 

2.57 

2.61 

2.65 

2.69 


f = grados de libertad 

°Reproducida con permiso de C.W. Dunnett, "New Tkbles for Multiple Comparison with a Control", 
Biometrics , vol. 20, no. 3, y de GW. Dunnett, “A Multiple Comparison Procedure for Comparing Several 
Treatments with a Control", Journal of the American Statistical Association, vol. 50 
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IX, Valores criticos para la prueba de Dunnett para comparar tratamientos con un control* 

do ,01 (<* /) 

Comparaciones de dos colas (contmuacidn) 


/ 



a - 1 = 

niimero de medias de tratamientos (sin incluir el control) 


1 

2 

3 

4 

5 

6 

7 

8 

9 

5 

4.03 

4.63 

4,98 

5,22 

5.41 

5.56 

5.69 

5.80 

5.89 

6 

3.71 

4.21 

4.51 

4,71 

4.87 

5.00 

5.10 

5,20 

5.28 

7 

3.50 

3.95 

4.21 

4.39 

4.53 

4.64 

4.74 

4.82 

4,89 

8 

3.36 

377 

4.00 

4.17 

4.29 

4.40 

4.48 

4,56 

4.62 

9 

3.25 

3.63 

3.85 

4.01 

4.12 

4,22 

4.30 

4,37 

4.43 

10 

3.17 

3.53 

3.74 

3.88 

3.99 

4.08 

4.16 

4.22 

4.28 

11 

3.11 

3.45 

3,65 

3,79 

3.89 

3.98 

4.05 

4.11 

4.16 

12 

3.05 

3.39 

3.58 

3.71 

3.81 

3,89 

3,96 

4.02 

4.07 

13 

3.01 

3.33 

3.52 

3.65 

3.74 

3,82 

3.89 

3.94 

3.99 

14 

2.98 

3.29 

3.47 

3.59 

3.69 

3.76 

3,83 

3.88 

3,93 

15 

2.95 

3.25 

3,43 

3.55 

3.64 

3.71 

3.78 

3.83 

3.88 

16 

2.92 

3.22 

3,39 

3.51 

3.60 

3.67 

3,73 

3.78 

3.83 

17 

2.90 

3.19 

3.36 

3.47 

3.56 

3.63 

3,69 

3,74 

3.79 

18 

2.88 

3.17 

3.33 

3.44 

3.53 

3.60 

3.66 

3.71 

3.75 

19 

2.86 

3.15 

3.31 

3.42 

3.50 

3.57 

3,63 

3.68 

3.72 

20 

185 

3.13 

3.29 

3.40 

3.48 

3.55 

3.60 

3.65 

3,69 

24 

2.80 

3.07 

3.22 

3.32 

3.40 

3.47 

3.52 

3,57 

3,61 

30 

2.75 

3.01 

3.15 

3.25 

3.33 

3.39 

3.44 

3.49 

3.52 

40 

2.70 

2.95 

3.09 

3.19 

3-26 

3.32 

3.37 

3.41 

3.44 

60 

2.66 

2.90 

3.03 

3.12 

3,19 

3.25 

3,29 

3.33 

3.37 

120 

2.62 

2.85 

2.97 

3.06 

3.12 

3,18 

3.22 

3-26 

3,29 


2.58 

2.79 

2.92 

3.00 

3.06 

3.11 

3.15 

3,19 

3.22 


do,05( fl I» /) 

Comparaciones de una cola 


/ 


a - 1 

= numero de medias de tratamientos (sin incluir el control) 


1 

2 

3 

4 

5 

6 

7 

8 

9 

5 

2.02 

2.44 

2.68 

2.85 

2.98 

3.08 

3.16 

3.24 

330 

6 

1.94 

2.34 

2.56 

2.71 

2.83 

2-92 

3.00 

3-07 

3.12 

7 

1.89 

2.27 

2.48 

2.62 

2.73 

2.82 

2,89 

2.95 

3,01 

8 

1.86 

2.22 

2.42 

2.55 

2.66 

2.74 

2.81 

2.87 

2.92 

9 

1.83 

2.18 

2.37 

2.50 

2.60 

2.68 

2.75 

2.81 

2.86 

10 

1.81 

2.15 

2.34 

2.47 

2.56 

2,64 

2,70 

2.76 

2.81 

11 

1.80 

2.13 

2.31 

2.44 

2.53 

2.60 

2.67 

2.72 

2.77 

12 

1.78 

2.11 

2.29 

2.41 

2.50 

2.58 

2-64 

2,69 

2.74 

13 

1.77 

2.09 

2,27 

2,39 

2.48 

2.55 

2.61 

2.66 

2.71 

14 

1.76 

2.08 

2.25 

2.37 

2,46 

2.53 

2.59 

164 

2.69 

15 

1,75 

2.07 

2,24 

2.36 

2.44 

2.51 

2.57 

2.62 

2.67 

16 

1.75 

2.06 

2.23 

2.34 

2.43 

2.50 

2.56 

2.61 

2.65 

17 

1.74 

2.05 

2.22 

2.33 

2.42 

2,49 

2.54 

2,59 

2.64 

18 

1.73 

2.04 

2.21 

2,32 

2.41 

2.48 

233 

238 

2.62 

19 

1.73 

2,03 

2.20 

2.31 

2.40 

2.47 

232 

237 

2.61 

20 

1.72 

2.03 

2.19 

2.30 

2.39 

2-46 

2.51 

256 

2.60 

24 

1,71 

2.01 

2.17 

2,28 

2.36 

2.43 

2.48 

233 

237 

30 

1.70 

1.99 

2.15 

2.25 

2.33 

2.40 

2.45 

2.50 

2.54 

40 

1.68 

1.97 

2.13 

2.23 

2.31 

2-37 

2.42 

2.47 

231 

60 

t-67 

1.95 

2.10 

2.21 

2.28 

2.35 

139 

2.44 

2.48 

120 

1.66 

1.93 

2,08 

2.18 

2-26 

232 

2.37 

2.41 

2.45 


1.64 

1.92 

2.06 

2.16 

2.23 

2.29 

134 

238 

2-42 
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IX. Valores crfticos para la prueba de Dunnett para comparar tratamientos con un control 

d 0 , 01 (a-l, /) 

Comparaciones de una cola (continuacidn) 


a- 1- numero de medias de tratamientos (sin incluir el control) 


/ 

1 

2 

3 

4 

5 

6 

7 

8 

9 

5 

3.37 

3.90 

4.21 

4.43 

4.60 

4,73 

4.85 

4.94 

5.03 

6 

3.14 

3.61 

3.88 

4.07 

4.21 

4.33 

4.43 

4.51 

4,59 

7 

3.00 

3.42 

3.66 

3,83 

3.96 

4.07 

4.15 

4,23 

4.30 

8 

2.90 

3.29 

3.51 

3.67 

3.79 

3.88 

3.96 

4,03 

4.09 

9 

2.82 

3.19 

3,40 

3,55 

3.66 

3.75 

3.82 

3,89 

3.94 

10 

2.76 

3.11 

3.31 

3,45 

3.56 

3.64 

3.71 

3.78 

3.83 

11 

2.72 

3.06 

3.25 

3,38 

3.48 

3.56 

3.63 

3.69 

3.74 

12 

2.68 

3.01 

3.19 

3.32 

3.42 

3.50 

3.56 

3.62 

3.67 

13 

2.65 

2.97 

3.15 

3.27 

3.37 

3.44 

3.51 

3.56 

3.61 

14 

2.62 

2.94 

3.11 

3.23 

3.32 

3.40 

3.46 

3,51 

3,56 

15 

2.60 

2.91 

3.08 

3.20 

3.29 

3.36 

3,42 

3.47 

3.52 

16 

2.58 

2.88 

3.05 

3.17 

3.26 

3.33 

3.39 

3.44 

3.48 

17 

2.57 

2.86 

3.03 

3.14 

3,23 

3.30 

3.36 

3,41 

3.45 

18 

2.55 

2.84 

3.01 

3.12 

3,21 

3.27 

3.33 

3.38 

3,42 

19 

2.54 

2.83 

2.99 

3,10 

3.18 

3.25 

3.31 

3.36 

3.40 

20 

2.53 

2.81 

2.97 

3.08 

3,17 

3.23 

3.29 

3.34 

3,38 

24 

2.49 

2.77 

2.92 

3.03 

3.11 

3.17 

3.22 

3.27 

3.31 

30 

2.46 

2.72 

2.87 

2.97 

3.05 

3,11 

3.16 

3.21 

3.24 

40 

2.42 

2.68 

2.82 

2,92 

2.99 

3,05 

3.10 

3,14 

3.18 

60 

2.39 

2.64 

2.78 

2.87 

2.94 

3.00 

3.04 

3.08 

3.12 

120 

2.36 

2.60 

2.73 

2.82 

2.89 

2.94 

2.99 

3.03 

3.06 

oo 

2.33 

2.56 

2.68 

2.77 

2,84 

2.89 

2.93 

2.97 

3,00 
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XI. Ntimeros aleatorios 41 


10480 

15011 

01536 

22368 

46573 

25595 

24130 

48360 

22527 

42167 

93093 

06243 

37570 

39975 

81837 

77921 

06907 

11008 

99562 

72905 

56420 

96301 

91977 

05463 

89579 

14342 

63661 

85475 

36857 

53342 

28918 

69578 

88231 

63553 

40961 

48235 

09429 

93969 

52636 

10365 

61129 

87529 

07119 

97336 

71048 

51085 

12765 

51821 

02368 

21382 

52404 

01011 

54092 

33362 

52162 

53916 

46369 

07056 

97628 

33787 

48663 

91245 

85828 

54164 

58492 

22421 

32639 

32363 

05597 

29334 

27001 

87637 

02488 

33062 

28834 

81525 

72295 

04839 

29676 

20591 

68086 

00742 

57392 

39064 

05366 

04213 

25669 

91921 

26418 

64117 

00582 

04711 

87917 

00725 

69884 

62797 

69011 

65795 

95876 

25976 

57948 

29888 

09763 

83473 

73577 

91567 

42595 

27958 

17955 

56349 

90999 

46503 

18584 

18845 

92157 

89634 

94824 

14577 

62765 

35605 


02011 

87647 

91646 

85393 

30995 

89198 

97265 

76393 

64809 

61680 

07856 

16376 

16656 

06121 

91782 

42751 

27756 

53498 

69994 

98872 

31016 

07972 

18876 

20922 

10281 

17453 

18103 

53988 

53060 

59533 

33276 

70997 

79936 

03427 

49626 

69445 

92737 

88974 

33488 

85689 

48237 

52267 

08178 

77233 

13976 

51259 

77452 

16308 

60268 

89368 

19885 

94904 

31273 

04146 

58586 

23216 

14513 

09998 

42698 

06691 

14346 

09172 

30168 

74103 

47070 

25306 

24200 

13363 

38005 

87308 

58731 

00256 

07351 

19731 

92420 

96423 

24878 

82651 

26432 

46901 

20849 

66432 

84673 

40027 

26422 

44407 

44048 

94305 

26766 

25940 

77341 

42206 

35126 

56170 

86324 

88072 

55293 

18988 

27354 

88604 

67917 

48708 

12908 

30883 

18317 

30134 

04024 

86385 

49127 

20044 

59931 

49618 

02304 

51038 

78171 

84610 

82834 

81263 

39667 

47358 


69179 

14194 

62590 

27982 

53402 

93965 

15179 

24830 

49340 

39440 

53537 

71341 

60468 

81305 

49684 

18602 

70659 

90655 

71194 

18738 

44013 

94595 

56869 

69014 

57740 

84378 

25331 

38867 

62300 

08158 

56865 

05859 

90106 

18663 

72695 

52180 

36320 

17617 

30015 

67689 

93394 

01511 

47564 

81056 

97735 

60756 

92144 

49442 

55322 

44819 

01188 

18594 

29852 

71585 

83149 

98736 

23495 

76988 

13602 

51851 

90229 

04734 

59193 

76468 

26384 

58151 

94342 

28728 

35806 

45834 

15398 

46557 

60952 

61280 

50001 

66566 

14778 

76797 

89768 

81536 

86645 

32832 

61362 

98947 

37937 

63904 

45766 

39972 

22209 

71500 

74087 

99547 

81817 

76222 

36086 

84637 

26575 

08625 

40801 

18912 

82271 

65424 

28290 

35797 

05998 

29880 

99730 

55536 

06115 

20542 

18059 

20655 

58727 

28168 

09922 

25417 

44137 

56873 

56307 

67607 


“Reproducida con permiso de Probability and Statistics in Engineering and Management Science, 3a. ed., W.W. 
Hines y D C. Montgomery, Wiley, Nueva York 
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XU Rclaciones de alias para disefios factoriales fraccionados 2 k ~^ con k < 15 y n S 64 


Disefios con 3 factores 
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Gcneradores del diseno 
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2 bloques de 8: AB = CE = FG = DH 
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Disenos con 10 factored 
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2 bloques de 8 : AE = BC = DF — GH 
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xn. p^laHnnps de alias para diseflps factoriales fraccionados 2^ conk < 15 y n < 64 (continuaddn) 

Disenos con 12 factores 


w) 2 12-8 ; fraccion 1/256 de 12 factores 
en 16 corridas 


Resolution III 


Generadores del diseno 
E - ABC F = ABD G = ACD H = BCD 
J = ABCD K = AB L - AC M = AD 


Alias 

A = HJ = BK - CL = DM 
B = GJ = AK = EL = FM 
C = FJ = EK=AL = GM 
D = EJ = FK = GL as AM 
E = DJ = CK = BL = HM 
F = CJ = DK = HL - BM 
G-BJ = HK = DL = CM 
H — AJ - GK = FL = EM 
J = DE -CF = BG = AH 
K = AB = CE = DF = GH 
L = AC = BE = DG = FH 
M = AD = BF - CG = EH 

AE = BC = FG = DH =KL=JM 

AF = BD = EG = CH =JL- KM 
AG = EF = CD = BH =JK = LM 

2 bloques de 8: AE = BC = FG = DH = KL = JM 
Disenos con 13 factores 

x ) 2 13-9 ; fraccion 1/512 de 13 factores 
en 16 corridas 

Generadores del diseno 
E = ABC F = ABD G = ACD H = BCD 
J = ABCD K ~ AB L~ AC M = AD N = BC 


Resolution III 


Alias 

A = HJ = BK = CL = DM = EN 
B -GJ = AK = EL = FM = CN 
C = FI = EK — AL = GM = BN 
D = EJ = FK = GL — AM = HN 
E = DJ = CK = BL = HM - AN 
F = CJ = DK = HL = BM = GN 
G = BJ = HK = DL = CM = FN 
H = AJ = GK - FL = EM ~DN 
J = DE = CF = BG = AH = MN 
K = AB — CE= DF = GH = LN 
L = AC = BE - DG = FH = KN 
M = AD = BF = CG = EH = JN 
N ~ BC = AE = FG = DH = KL=JM 
AF = BD = EG = CH -JL- KM 
AG = EF = CD = BH - JK - LM 

2 bloques de 8: AF = BD = EG — CH — JL = KM 
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X1L Relaciones de alias para diseftos factoriales fraccionados 2^ con k < 15 y n £ 64 (continuacidn) 

Disenos con 14 factores 

>’) 2 14 ~ 10 ; fraccidn 1/1024 de 14 Resoluci6n III 

factores en 16 corridas 

Generadores del diseno 

E = ABC F = ABD G = ACD H = BCD J = ABCD 
K = AB L = AC M = AD N = BC 0=BD 

Alias 

A = HJ = BK =CL = DM = EN = FO 

B = GJ = AK = EL = FM = CN = DO 
C~ FJ = EK = AL = GM = BN = HO 
D = EJ - FK — GL — AM = HN = BO 
E = DJ — CK — BL = HM = AN = GO 
F — CJ = DK = HL = BM = GN = AO 
G = BJ — HK = DL = CM = FN = EO 
H — AJ = GK = FL = EM = DN = CO 
J = DE — CF = BG — AH = MN = LO 
K = AB — CE = DF = GH = LN - MO 
L — AC = BE = DG ~ FH ~ KN = JO 
M - AD = BF = CG = EH - JN = KO 
N = BC ~ AE = FG = DH = KL= JM 
O = BD — AF = EG = CH ~JL = KM 
AG = EF = CD — BH =JK= LM = NO 

2 bloques de 8 :AG = EF - CD = BH = JK = LM = NO 

Disenos con 15 factores 

z) 2 1 ' - 11 ; fraccidn 1/2048 de 15 Resoluci6n III 

factores en 16 corridas 

Generadores del diseno 

E = ABC F = ABD G = ACD H = BCD J = ABCD 

K - AB L = AC M = AD N = BC 0 = BD P = CD 

Alias 

A = HJ - BK = CL = DM = EN = FO = GP 
B = GJ ~ AK = EL = FM = CN = DO = HP 
C = FJ = EK = AL = GM = BN = HO = DP 
D - EJ = FK - GL = AM - HN - BO = CP 
E = DJ - CK = BL- HM - AN = GO = FP 
F -CJ = DK - HL = BM = GN = AO = EP 
G = BJ = HK = DL = CM — FN - EO = AP 
H = AJ = GK = FL - EM = DN = CO ~ BP 
J = DE = CF = BG — AH = MN = LO = KP 
K = A B - CE = DF = GH = LN = MO = JP 
L = AC = BE = DG = FH = KN = JO = MP 
M = AD = BF = CG = EH =JN- KO = LP 
N = BC = AE = FG = DH =KL= JM = OP 
O = BD = AF = EG = CH =JL = KM = NP 
P = CD = EF — AG = BH = JK = LM = NO 
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Tabla XIII. Glosario para el uso de Design Expert 

Actual value Valor real 

Adeq precision Precisi6n adecuada 

Adj MS (adjusted mean square) Cuadrado medio ajustado 
Adj R-squared R cuadrada ajustada 

Adj SS (adjusted sum of squares) Suma de cuadrados ajustada (SS ajustada) 

Analysis of variance An&lisis de varianza 

Coefficient estimate Estimation del coeficiente 

C.V (coefficient of variation) Coeficiente de variation 
Cl (confidence interval) Intervalo de confianza 

Cook’s distance Distancia de Cook 

Cor total (corrected total) Total corregido. Suma de los valores de 

respuesta corregidos por la media. Se llama 
comunmente suma de cuadrados totales 
DF (degrees of freedom) Grados de libertad 

DDF (denominator degrees of freedom) Grados de libertad del denominador 

Diagnostic case statistics Estadfsticos de diagnostico del caso 
Error term T6rmino del error 

Estimated mean Media estimada 

Expected mean square Cuadrado medio esperado 

Lack of fit Falta de ajuste 

Least squares means for strength Medias de mmimos cuadrados de la 

resistencia 

Leverage Accidn de palanca* Potencial de un punto del 
diseno para influir en los coeficientes del 
ajuste del modelo, Deben evitarse valores 
cercanos a uno 
Mean Media 

Mean difference Diferencia media 

Mean square Cuadrado medio 

Means for covariates Medias de las covariables 

NDF (numerator degrees of freedom) Grados de libertad del numerador 

Operator fixed Operador fijo 

Operator random Operador aleatorio 

Outlier t Punto atipico t 

Fred R-squared R cuadrada predicha 

Predicted value Valor predicho 

PRESS (Prediction error sum of squares) Suma de cuadrados del error de prediction 

Pure error Error puro 

R-squared R cuadrada 

Root MSE (root mean square error) Raiz cuadrada del cuadrado medio del error 
Seq SS (sequential sum of squares) Suma de cuadrados secuencial 
Std. Dev (standard deviation) Desviacidn estandar 

Standard error (SE) Error estandar 

SE of difference (standard error of difference) Error estandard de la diferencia 
Std . error of estimation Error est&ndar de la estimacidn 

SE mean (standard error of the mean) Error esfimdar de la media 

Standard order Orden estandar 

Student residual Residual de Student 

Sum of squares Suma de cuadrados 

Variance component Componente de la varianza 


Indice 


Aberracidn, 326 

Aditividad del modelo de bloques aleatonzados, 136. Ver 
tambiin Prueba de interacciones (no aditividad) 
Aleatorizacidn, 12, 13, 61, 126, 148 
Algoritmo de andlisis para el diseno 2*, 242 
Algoritmo de intercambio, 469 
Alias, 304 

Alias parciales, 344, 380, 383 

Andlisis candnico del modelo de superficie de respuesta de 
segundo orden, 440 
Andlisis de covarianza, 15, 126, 604 
Andlisis de residuales, 76, 79, 185, 224, 400, 416, 563 
Analisis de varianza, 60, 63, 66 
Anllisis de varianza de dos factores, 177 
Andlisis de varianza de un solo factor, 64 
Andlisis de varianza simple o de una variable, 64 
Andlisis interbloques, 161 
Analisis intrabloques, 161 
Arreglo exterior, 491 
Arreglo interior, 491 
Ascenso mds pronunciado, 227, 430, 435 
Aumento del diseno, 409. Ver tambttn Separacidn de abas 
en las interacciones y Contraccidn de disenos facto- 
riales fraccionados 


Bloque principal, 291, 297, 373 
Bloques completes, 127 
Bloques incompletos, 154 

Cdlculos en el analisis de varianza, 70, 72 
Cambio en el efecto de la media en una operaddn evoluti- 
va (EVOP), 484, 488 

Car deter iterativo de la experimentatidn, 17, 20. Ver tam- 
bten Experimentacidn secuencial 
Ciclo en id operation evolutiva (EVOP), 484 
Codificacidn de los datos en un andlisis de varianza, 72 
Coeficiente de confianza, 42 
Coeficiente de variacidn, 104 
Coeficientes de regresidn parcial, 393 
Combinacidn de fracciones para estimar efectos, 303, 306, 
315, 339, 347, 348 


Combinacidn de inforraacidn interbloques e intrabloques, 
162 

Combinacidn de los cuadrados medios para estimar el 
error, 535 

Comparacidn de medias por pares, 96-104 
Comparacidn de todos los contrastes, 95 
Comparacidn de tratamientos con un control, 103 
Comparacidn grdfica de medias, 89 
Comparaciones multiples, 88, 133, 182 
Componente I de una interaccibn, 366 
Componente J de una interaccibn, 366 
Componente W de una interaccibn, 372 
Componente X de una interaccibn, 372 
Componente Y de una interaccibn, 372 
Componente Z de una interaccibn, 372 
Componentes de la varianza, 65, 511, 512, 518, 565 
Componentes de una interaccibn, 204, 366 
Condiciones bptimas, 427, 429, 430, 436 
Conexibn entre andlisis de varianza y regresibn, 112 
Confusibn completa, 299 
Confusi6n en el diseno 2*, 288 
cuatro bloques, 296 
dos bloques, 289 
mds de cuatro bloques, 297 
Confusibn en el diseno 3*, 373 
mds de nueve bloques, 378 
nueve bloques, 377 
tres bloques, 373 
Confusibn parcial, 299 

Construccibn de disenos factorials fraccionados, 307, 318, 
337, 379-381 

Contraccibn completa, 340 
Contraccibn parcial, 349 
Contraste estandarizado, 92 
Contraste ortogonal, 93, 221, 231 
Contrastes, 90, 93, 221, 231, 290 
Cordillera creciente, 448 
Cordillera estacionaria, 448 
Corridas axiales, 274, 365, 478 
Covariable, 604 
Covarianza, 26 

Criterio de prediccibn adecuada, 104 
Criterio para seleccionar un diseno, 455 
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Criterios de diseno, 4 55 
Cuadrado latino estandar, 148 
Cuadrados latinos ortogonales, 151, 365 
Cuadrados medios, 68, 179 
Cubo con centros en las caras, 459 
Curioseo o sondeo de datos, 94 

Curva de operation caxacterfstica, 40, 107, 139, 189, 529 
Curva OC. Ver Curva de operation caxacterfstica 
Curvatura, 174, 272, 432 

D de Cook, 420 

Datos no balanceados en el analisis de varianza, 75, 600 
Datos proportionates en un diseno factorial no balanceado, 
600 

Definition de contrastes, 290, 296, 373 
DesviaciOn estandar muestral, 27 
Determination analftica de una transformation, 590 
Determination del tamano de la muestra, 40, 107-110, 139, 
189, 529 

Diagrama de caja, 23, 62 
Diagrama de dispersiOn, 662 
Diagrama de puntos, 21, 22 

Direction del ascenso m£s pronunciado. Ver Ascenso mas 
pronunciado 

Diseno anidado de dos etapas, 557 
Diseno anidado de m etapas, 566 
Diseno anidado de tres etapas, 566 
Diseno balanceado, 154, 558, 600 
Diseno b£sico, 307, 317, 381 

Diseno central compuesto, 11, 274, 275, 365, 441, 456 
Diseno de aberration minima, 326 
Diseno de arreglo combinado, 492, 494 
Diseno de arreglo cruzado, 491 
Diseno de bloques aleatorizados, 50, 126, 207 
bloques completos, 127 
bloques incompletos, 154 
Diseno de Box-Behnken, 458 
Diseno de comparaciones pareadas, 47, 50 
Diseno del cuadrado latino, 144, 148, 209, 365 
Diseno en parcelas subdivididas, 557, 573, 578 
Diseno en parcelas subdivididas en franjas, 583 
Diseno experimental completamente aleatorizado, 33, 64, 
176, 207 

Diseno experimental y diseno de productos, 8, 11 

Diseno factorial 2 2 , 5, 219 

Diseno factorial 2 3 , 6, 228 

Diseno factorial 2 4 , 7, 246 

Diseno factorial 2*, 7, 218, 242 

Diseno factorial anidado, 569 

Diseno factorial no balanceado, 600 

Diseno hexagonal, 461 

Diseno jerarquico. Ver Disenos anidados 

Diseno no balanceado, 75, 144, 600 

Diseno no replicado. Ver Replica unica 

Diseno optimal A, 468 

Diseno optimal D, 468 


Diseno optimal G, 468 
Diseno optimal V, 468 
Diseno pentagonal, 461 

Diseno robusto, 488. Ver tambiin Estudios de robustez de 
procesos 

Diseno rotable, 457 

Diseno simplex para el modelo de primer orden, 456 

Disenos 2 k ~\ 304-317 

Disenos 2 k ~\ 317 

Disenos 2*-*, 326 

Disenos 3*, 363, 372 

Diseno 3*" 1 , 379 

Disenos 3*-*, 382 

Disenos alternados o entrecnizados, 150 
Disenos anidados, 557-568 
Disenos anidados por etapas escalonados, 566 
Disenos centrales compuestos pequenos, 461 
Disenos cuboidales, 450 

Disenos de bloques incompletos balanceados, 154 

Disenos de cuadrados grecolatinos, 151, 383 

Disenos de puntos frontera, 478 

Disenos de resoluciOn III, 306, 337 
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Como realizar una experimentacion industrial optima 
Esta obra para ingenieros, cientificos y expertos en 
probabiiidad propordona el enfoque m£s efieaz para 
aprender a diseriar. conducir y analizar experiments 
que oplimlcen la caltdad y el desemperio de productos 
y proceso. En esta nueva edicibn completamente 
revisada y actualized^, e! autor trata con mayor de- 
tenimiento los disefios factonales y faetoriales fraccio- 
nados r y presenta nuevas tecnicas de an£lisis, como 
el modelo lineal generalization Asimismo, ofrece un 
estudio mas amplb de los experimentos con factores 
aleatorios, la metodologia de superficies de respuesta. 
los experimentos con mezcias y los metodos para es- 
tudios de robustez de procesos. 

El libro tambien ilustra dos de las herramientas de 
software mas poderosas hoy en dla para el diserio ex- 
perimental: Design Expert- y Minitab' A lo largo del 
texto se incluyen salidas de estos programas, junto 
con una explicacidn detalladd de la forma en que se 
sstbn usando las computadoras para el anSlisis y el 
diseno de experimentos. 

* El silio del libro en la web ofrece recursos adiciona- 
les para estudiantes y profesores. 
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